はじめに
この記事では、Stable Diffusion 3 medium モデルを Google Colab で実装する手順を解説しています。
開発環境
Google Colab (L4GPU、A100GPU)
ライブラリのインストール
!pip install --upgrade diffusers[torch]
コードの実行
1. Hugging Face へログイン
from huggingface_hub import login
login()
2. Stable Diffusion 3 medium の読み込み
つまづいた箇所
- Hugging Face トークンの権限が write になっていないため、エラー → Hugging Face トークンの権限が write にすること
- local_files_only がデフォルトで True になっているため、モデルのダウンロード時にエラー → local_files_only=False で解決
import torch
from diffusers import StableDiffusion3Pipeline
HF_TOKEN = "あなたのHuggingFaceトークン"
pipe = StableDiffusion3Pipeline.from_pretrained(
"stabilityai/stable-diffusion-3-medium-diffusers",
torch_dtype=torch.float16,
use_auth_token=HF_TOKEN,
local_files_only=False
)
pipe = pipe.to("cuda")
3. 画像を生成する
image = pipe(
"Top quality, 1 beautiful woman, long Hair, brown hair, wearing Camisole & skirt, shy-smile, Sunlight, at street",
negative_prompt="",
num_inference_steps=84,
guidance_scale=7.0,
).images[0]
image
4. 参考
おわりに
- GPUメモリが21GBに張り付いていたので、GPUメモリ25GB以上ほしい。
- HuggingFaceトークンの権限管理が豊富に出来るようで勉強になった。