Stable DiffusionのアップグレードバージョンのSDXLでAI美女の生成検討をしてみました。今回はCivitaiなどで公開されている商用利用可能なモデルおよびLoRAを使って、プロンプトを工夫しつつ、より自然なAI美女の生成を検討してみました。是非皆さんの創作の参考にしていただければと思います。
※Cherry Picker XL(v1.0)追加(2023年08月15日)
※Cherry Picker XL(v1.1)、SpectrumBlendX、fuduki_mix(v0.8)、RealityCheck XL(alpha1.1)追加(2023年08月18日)
今回のゴール
各モデルやLoRAでのAI美女(主に日本人っぽいもの)の出力調整とテストを行う。
準備
今回の検討はComfyUIを通してSDXLを使いました。ComfyUIのセットアップの方法は私の過去の記事をご参考ください。(→ComfyUIのインストール方法と使用法)
また、今回使用したモデルおよびLoRAのリンクを示します。各モデルは最新の利用規定をご参照の上、自己責任でお使いください。なお、ダウンロードしたモデル(Checkpoint)は\models\checkpointsのフォルダの中に、また、LoRAモデルは\models\lorasのフォルダの入れて、ComfyUIを再起動することで使えるようになります。
今回使用したモデル(Checkpoint)
stable-diffusion-xl-base-1.0・・・SDXLのベースモデル
SDVN6-RealXL・・・リアルな画像の出力に定評があります
TalmendoXL・・・写真をベースとした学習モデル
DreamShaper XL・・・定番リアル系モデルのXL版
RunDiffusion XL・・・動物、自動車、人のリアルな出力を目指したモデル
Cherry Picker XL(v1.0、v1.1)・・・実写ベースのマージモデル
SpectrumBlendX(alpha)・・・実写系(?)マージモデル
fuduki_mix(v0.8)・・・yayoi_mixやkisaragi_mixの作者こたじろう氏の開発モデル
RealityCheck XL(alpha1.1)・・・実写系で自然言語に強いらしい
今回使用したLoRAモデル
Japanese Girl – SDXL・・・ai_white氏のLoRA。見本からは透明感のある女性が得意そう
Pretty Realistic Girl XL (PRG)・・・かわいい女性約150枚から学習したモデル
East asian female face・・・DreamShaperベースの学習モデル
ComfyUIでのLoRA設定
ComfyUIでLoRAを使うには、舌の様にWorkflowでcheckpointの直後にLoRAの読み込みを行うだけでOKです。もし、トリガーワードがあれば、別途プロンプトに入れてやります。
もし、設定が面倒な方は私のworkflowがメタファイルに付加したPNGファイルを置いておきますので、これをComfyUIにドラッグしてやるだけでも使えると思います。1.5倍のUpScaleも接続しています。自己流なので間違っているのかもしれませんが、良かったらご参考ください。今回は、LoRAが対応していないのでRefinerは使っていません。
ComfUI設定用PNG
(SDXLbaseモデル+Japanese Girl – SDXL)
ComfyUIのWorkflow
各モデルでの画像生成例
各モデルで10枚ほど画像を出力して、その中から私の好みの画像を2枚選んで紹介します。プロンプトはすべてのケースでおおむね同じにしていますが、少し微調整しています。モデルによってはちょっと厚化粧になってしまったのもありますが、それは多分プロンプトのせいです。
画像生成プロンプトの主な要素
アジア系美女または日本人美女、ソロ、レイヤー入りのロングヘア、ルーズTシャツ+ジーンズ、微笑、リアル写真、海岸、砂浜、波、近代的なビル、インスタグラム、インフルエンサー、写真集、高画質画像、必要に応じてリップ調整
※2023年08月15日プロンプト調整で一部写真差し替え
※今回の比較ではプロンプトが合っていないモデルもあり、今回の結果がモデルの優劣を表すものではありません。あくまで参考程度に捉えてください。
stable-diffusion-xl-base-1.0
SDVN6-RealXL
TalmendoXL
DreamShaper XL
RunDiffusion XL
Cherry Picker XL(v1.0)
Cherry Picker XL(v1.1)
SpectrumBlendX(alpha)
fuduki_mix(v0.8)
RealityCheck XL
Baseモデル+LaRA(Japanese Girl – SDXL)
Baseモデル+LoRA(Pretty Realistic Girl XL )
DreamShaper XL+LoRA(East asian female face)
まとめ
いずれも甲乙つけ難い出来です。AI美女の細かい表現についてはSD1.5系の方がモデルが豊富なこともあり、現時点ではAI美女生成はSD1.5系が中心に進む公算が高いですが、BRAVシリーズなどの表現力の高いモデルがSDXLで出てくると置き換えが進んでくるかもしれません。一方で、LoRAが作りやすいとの話もあり、個別特化のリアル系モデルはSDXLの高画質なものがSD1.5系を凌駕するかもしれません。
コメント