AI画像生成

  • Stable Diffusion、DALL·E 2、MidJourneyは全て異なるものだ
  • この分野は、昨年(2021年1月)にOpenAIがCLIPを公開したことで革命が起こり、これにより画像生成のガイドが可能になった
  • DALL·E 2
    • モデルかつサービス
    • インペインティングは最高の機能だが、現状ランダムなのでアイデア出しや企業的な用途に最も適している
    • 来年にはコストが10分の1以下になり、APIも公開されると思われる
    • トレーニングデータは著作権のあるイメージなので、オープンソースにはならないと思う
  • Midjourney
    • ベンチャーキャピタルの資金提供を受けたベンチャー、ではなく研究所
    • 非常に独特な絵画のようなスタイルを持っている
    • 現在は競合サービスと同じオープンソースのモデルを利用しているが、出力の一貫性の保持に膨大な労力が費やされている
    • 出力のランダム性が強いが、ある程度コントロールは可能
    • オープンソースにされている部分とそうでない部分がある
  • Stable Diffusion
    • アートからプロダクトまで、あらゆるタイプのイメージに対応する一般的な基礎モデル
    • 公式のプロシューマー向けサービス「DreamStudio」
    • ベータ版のテスト出力はプリプロもポスプロも行っていないが、これらを使うことで格段に仕上がりが良くなり、きめ細かな調整が可能になる
    • オープンソースのモデルなので、誰でも使うことができる
    • コードが公開されているので、誰もがこのモデルを改良し、構築することができる

英語スキルはあるといいですが、別に今時なくても何とかなります


Stable Diffusion web UI AUTOMATIC1111版のローカル環境構築手順

  1. https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Dependencies で指定されているものをインストールおよびDLする
  2. インストールしたいディレクトリに移動し git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui を実行する
  3. DLしたモデルファイルをmodels/stable-diffusionフォルダに入れる
  4. webui-user.bat を非管理者として実行する
  5. Running on local URL: http://127.0.0.1:7860と出たらそのURLをブラウザで開く
  6. アップデートのため、定期的にインストールフォルダでgit pullを実行する。

FAQ

  • Q. Batch countの上限を増やすには?
  • A. webui.batと同じディレクトリにある「ui-config.json」をテキストエディタで開く。9行目の「"txt2img/Batch count/maximum": 16,」の数値を増やして保存しStable Diffusionを再起動する

Stable Diffusion TIPS

セキュリティ

  • モデル(ckpt)や、Texutual Inversionのbinファイルには、任意のプログラムコードを仕込むことが簡単にできます(詳細はpickleの脆弱性などで検索)。信頼できるソースからのモデルや評判のあるモデル以外の怪しいファイルは読み込まないように注意が必要です。(もしくはDockerなどセキュリティ的に閉じた環境での利用など対策を取る必要があります)

性能など

  • 高解像度にしたい → AUTOMATIC1111版の「Highres Fix」使用である程度解消 学習データが512x512なので、1024x512など片方は512以下にしないとおかしくなる。RealESRGAN等で高解像度化したほうがよい。 StableDiffusion V2(時期不明)では1024x1024学習になる予定(2022/9/20現在)
  • 画像生成時間は、解像度、step数、サンプラで違う。他のパラメータは多分あまり影響はない
  • Windows/WSL2/Docker上でのStableDiffusionは、素のWindowsでのStableDiffusionと同等の性能。
  • サンプラの差は大きい。k_euler_aとk_heunでは2倍差
  • 早い ← k_euler_, k_euler, DDIM, PLMS > l_lms > k_dpm_2_a, k_dpm2, k_heun → 遅い

SAMPLER COMPARISON

ハード

  • K80(24GB)めっちゃ安いんだけどあり? → 古いからStableDiffusionが使ってるPytorch動かない
  • 複数GPUにすれば高解像度にできる? → Geforceでは無理。複数GPU並行実行すればその分高速にはできる
  • ローカル動作性能(出典: https://rentry.org/voldy)
    • 9xx(Maxwell) 動くが遅い
    • 10xx(Pascal) 動くがそこそこに遅い
    • 16xx(Turing without Tensor) グリーンスクリーンバグ
    • 20xx(Turing) 動く
    • 30xx(Ampere) 動くし速い
    • 40xx(Ada Lovelace) 最適化が進んでおらず遅い?(Reddit等での報告)

RENDER TIME BY GPU (50 steps)


リンク集

Stable Diffusionの派生

Stable Diffusionのガイドいろいろ

SD&MJプロンプト関連

その他


ここは既存のAI画像生成サービスの具体的な技術や動向について語り合うスレです
AI画像生成の未来や、イラストレーターの権利といった一般的な話題は以下のスレッドでお願いします
【Midjourney】AI関連総合10【StableDiffusion】
AIイラスト 愚痴、アンチ、賛美スレ part4

Edit
Pub: 04 Sep 2022 21:50 UTC
Edit: 26 Feb 2024 00:35 UTC
Views: 23070