Stable Diffusion初心者がオンラインサーバーでStable Diffusionを使える『生成AI GO』を使ってAI美女を作る方法をまとめました。設定する部分が多くて難しいStable Diffusionですが、まずはAI美女を例にAI画像生成を簡単に作れる手順の例の説明します。どこからやったら良いか分からない方は是非ご参考ください。
※本記事は『生成AI GO』の広告およびプロモーションを含みます。
『生成AI GO』の説明は別の記事をご参考ください。『生成AI GO』は有料サービスですが、2週間の無料期間がありますので、試しに使ってみたいという方は是非お試しください。申し込み時にクーポンコード(nH87d5Gh)を使うと2週間の無料期間に加えて、初月の月会費は半額になります。
記事「『生成AI GO』で快適Stable Diffusion環境を手に入れる」
『生成AI GO』申し込みサイトへのリンク
『生成AI GO』のWebUI起動
『生成AI GO』にログインしたらWebUIを起動します。起動時は使用する拡張機能を選択できます。セットアップする拡張機能が多いとUIの動作がその分重くなりますし、分かりにくくなるので、ここでは最低限の拡張機能だけで起動します。「Beginner」を選んで、「Start App」ボタンを押します。WebUIが起動するまで30秒ほど掛かります。起動したら、右上の更新ボタンを押して画面を更新します。もし、サーバーが立ち上がっていたら下記のようにstable-diffusion-webuiへのリンクが表示されますので、クリックします。もし、Bootingのままの時はもう少し待って、再び更新してみてください。
AI美女生成のための基本設定
Stable Diffusion WebUIの設定にはいろいろな技術があって、どれが正解というものはありませんが、私がよく使う比較的初心者でもやりやすい方法を『生成AI GO』の基本設定で使えるコマンドにアレンジして説明したいと思います。『生成AI GO』以外を使う場合でも同じようにできますので、是非ご参考ください。
設定は以下の①~の手順で入力します。
①Checkpoint(モデル)の選択
今回、モデルは2023/09/10現在、『生成AI GO』に標準でセットされている「Beautiful Realistic Asians」のv6(BRAV6)を使います。このモデルはアジア系の女性写真に特化したモデルで、グラビアのような美しい女性を出力できます。現在、最新のSDXL系ではなく、SD1.5系のモデルですが、クオリティーの高さは依然としてトップクラスです。
②プロンプトの入力
プロンプトには以下の基本的な内容のプロンプトをベースとして入力します。
1girl, solo, (RAW photo, best quality), (realistic, photo-realistic:1.3), masterpiece, an extremely delicate and beautiful, extremely detailed
③ネガティブプロンプトの入力
ネガティブプロンプトには以下のものを使います。長いですが、SD1.5系ではネガティブプロンプトをしっかり入れた方が良好な画像が生成するので、定型文だと思っていただければと思います。(生成目的に応じてアレンジはした方が良いですが、ここでは決め打ちでいきます。)
easynegative, badhandv4, logo, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans, extra fingers, fewer fingers, ((watermark:2)), (white letters:1), (multi nipples), bad anatomy, bad hands, text, error, missing fingers, missing arms, missing legs, extra digit, fewer digits, cropped, worst quality
④Sampling methodの設定
Sampling methodを説明すると難しいのですが、画像生成時の計算方法だと思っていただければと思います。ここでは私が良く使う「DPM++2M SDE Karras」に設定します。
⑤CFGスケール
どれだけプロンプトに忠実に画像を生成するかの指標です。大きな数字にすると思い通りの画像が生成しやすいですが、大きすぎると画像の品質が低下してしまうことがあります。ここでは、Brav6のモデルが生成しやすい画像を生成させるために、少し低めの5に設定します。通常5~10くらいの範囲で設定します。
⑥NSFWフィルター
NSFWは「Not Safe For Work」の略で、フィルターは不適切な画像が生成しそうなときに画像を非表示にしてくれる機能です。不適切な画像のフィルターは重要ですが、感度の調節が難しく、普通の画像を生成しようとした場合でもフィルターに引っかかってしまう可能性があるので、ここでは外します。皆さんも自己責任で設定をお願いします。強度も調節できるので、必要に応じて適切な値に設定してください。
⑦画像生成
設定が終わったら、「Generate」ボタンを押します。ボタンを押すごとに毎回違った画像が生成します。今、「シード」という初期パラメーターがランダムになるように設定していますので、毎回違う画像が出てきます。のちにやりますが、シードを「固定」にすると毎回ほぼ同じ画像が生成します。
以下の上の設定をおこなって、画像を生成したところを示します。
画像のアレンジ
それでは上記のベースの画像生成条件からアレンジしていきます。具体的には、生成する美女の髪型、服装、容姿、表情、ポーズ、シチュエーション、撮影条件、背景など、「プロンプト」で指定すると良いです。プロンプトは英語でAIに理解しやすい言葉で記述することが必要です。『生成AI GO』ではchatGPTと同じ技術を使ってプロンプトを生成してくれる「GPT-PromtGen」という拡張機能が標準で搭載されています。今回はそれを使ってプロンプトを生成してみます。(プロンプト集などを見て自分でプロンプトを作っても良いです)
「GPT-PromptGen」を開いて「Prompt request」のところに自由に生成したい写真のイメージをなるべく詳しく入力してください。どんな内容でもGPTがそれらしいプロンプトの形にしてくれます。
私の入力例とGPTで生成されたプロンプトを示します。私の入れたリクエスト、変換間違いの誤字もありますが、GPTが良いように考えてくれてプロンプトを生成してくれました。また、同時にプロンプトの説明も出力してくれます。
長い黒髪が白いワンピースを着た美しい女性、幻想的な教会の中で立って、こちらを見つめてクールな表情を浮かべている、プロの写真家が撮影した上半身の写真、美しい宝石をたくさん身につけている、協会は木造作りでステンドガラスから美しい光が差し込んでいる
long black hair, white dress, beautiful woman, standing, inside a fantastical church, looking at the viewer, cool expression, professional photographer, upper body shot, wearing many beautiful jewels, association, wooden structure with beautiful stained glass, (light shining through)
GPTに作ってもらったプロンプトは先ほどの基本設定のプロンプトに付け加えて、画像生成します。1枚では思ったような画像にならないかもしれないので、何枚か生成してみると良いです。今回のプロンプトでは下のような画像が得られました。
生成したイメージ通りの女性の画像ができました。ただし、この段階では画像は512×512で画素が粗いのです。そこで次に画像の品質を向上させるアップスケーラーを使ってみます。
アップスケーラーによる高画質化
アップスケールの方法を説明します。
①シードの読み出し
まずは今回生成した画像のシードを呼び出します。シードを設定するところの左の6つの点が円になっているボタンを押すと、直前で生成した画像のシードが「seed」欄に入ります。もし、アップスケールしたい画像が直前に生成したした画像ではない場合、デフォルト設定では生成した画像のファイル名のハイフン以下の部分がその画像のシードです。例えば、今回の画像の場合、「00024-2874678686.png」という名前なので、「2874678686」がシードになります。seed欄に画像のシード入力します。(PNG Infoからもシード値は調べることができます)
②Hires. fixをチェック
アップスケールするために、「Hires. fix」にチェックを入れます。これにより、アップスケーラーの設定が開きます。
③Upscalerの設定
Upscalerによりそれぞれ生成できる画像は微妙に異なります。ここでは私が良く使う「R-ESRGAN 4x+」を選択します。
⑤Hires stepsの設定
アップスケール時の計算回数です。ここでは20に設定します。
⑥Denoising strengthの設定
大きいと元の画像から大きく構図が変わってしまします。ここでは、元の構図を維持するために0.5に設定します。
⑦Upscale倍率の設定
ここでは2倍に設定します。
⑧画像生成
Generateボタンで画像生成します。
下記の今回の設定で画像が生成したところを示します。直前で設定したプロンプトなどの設定はそのままでアップスケールする必要があります。
非常に美しい女性の写真が生成できました。
補足
上で固定シードに設定した「seed」の値ですが、次の画像を生成する時には「-1」に戻して、ランダムなシードを取るように戻してください。
追加で入れるプロンプトを変えるだけでいろいろな画像が生成すると思いますので、いろいろ想像力を膨らまして、プロンプトを工夫して、好みのAI美女が生成しましょう。
『生成AI GO』は行った計算量によってトークンが消費されます。512×512の20ステップで1トークンで計算されます。アップスケーラーなどを使うと大量に多くのトークンが必要になるので、無駄なトークンを使わないように、アップスケールやステップ数の調整はちゃんと画像ができることを確認してからの方が良いです。
「生成AI GO」は2週間なら無料で使えますので、すでにStable Diffusionをローカルでお使いの方も試しに使うことができます。申し込み時にクーポンコード(nH87d5Gh)を使うと2週間の無料期間に加えて、そのまま継続して使った場合、初月の月会費は半額になりますので、是非この機会にお試しいただければと思います。
『生成AI GO』の申し込みは↓から。
https://www.genai-go.com/
コメント