GoogleColabでStableDiffusion3mediumを実装してみた

thumbnail

はじめに

この記事では、Stable Diffusion 3 medium モデルを Google Colab で実装する手順を解説しています。

開発環境

Google Colab (L4GPU、A100GPU)

ライブラリのインストール

!pip install --upgrade diffusers[torch]

コードの実行

1. Hugging Face へログイン

from huggingface_hub import login
login()

2. Stable Diffusion 3 medium の読み込み

つまづいた箇所

  • Hugging Face トークンの権限が write になっていないため、エラー → Hugging Face トークンの権限が write にすること
  • local_files_only がデフォルトで True になっているため、モデルのダウンロード時にエラー → local_files_only=False で解決
import torch
from diffusers import StableDiffusion3Pipeline

HF_TOKEN = "あなたのHuggingFaceトークン"

pipe = StableDiffusion3Pipeline.from_pretrained(
    "stabilityai/stable-diffusion-3-medium-diffusers",
    torch_dtype=torch.float16,
    use_auth_token=HF_TOKEN,
    local_files_only=False
)

pipe = pipe.to("cuda")

3. 画像を生成する

image = pipe(
    "Top quality, 1 beautiful woman, long Hair, brown hair, wearing Camisole & skirt, shy-smile, Sunlight, at street",
    negative_prompt="",
    num_inference_steps=84,
    guidance_scale=7.0,
).images[0]

image

4. 参考

おわりに

  • GPUメモリが21GBに張り付いていたので、GPUメモリ25GB以上ほしい。
  • HuggingFaceトークンの権限管理が豊富に出来るようで勉強になった。