初めての画像生成AIの手引き

スポンサーリンク
Stable Diffusion
スポンサーリンク

ここ1年で画像生成AIは大きな進歩を遂げました。当初は専門知識が必要だったり、設定が面倒だったり、使ってみたけど思ったような画像ができなかったりということもありました。しかし、今ではBingのimage creatorでつかえるDALL-E3を代表として、非常に手軽に、高品質の画像がAIで生成できようになりました。ここでは、これから画像生成AIを勉強してみようとする方に向けて、画像生成AIの活用の手引きをまとめたいと思います。この記事を読めばあなたも画像生成AIを使う準備ができるでしょう。

筆者について

当ブログの運営をしているタカと申します。昨年、画像生成AI「StableDiffusion」が世に初めて登場した瞬間から、この驚異的な技術に魅了されてきました。それはまるで、技術の進化が新しいアートの領域を開いていくような感覚。絵を描けない自分でも、画像生成AIを使えば面白い画像を生み出せるところに魅力を感じています。これまで、「StableDiffusion」の技術を中心に、新しい技術や使い方の提案などのオリジナル記事をブログやSNSで発信しています。また、画像生成AIの可能性をより多くの方に知ってもらいたく、セミナーや使い方の指導やコンサルタントを行って、画像生成AIの活用法などを提案しています。

画像生成AIとは?

画像生成AIはコンピューターが私たちの「指示」を聞いて画像を作り出してくれるAIです。コンピューターはあらかじめ「学習」されています。例えば、猫の画像を「これは猫だ」とコンピューターに覚えこませます。そのようにしてたくさんの画像で学習することで、様々なものの特徴をコンピューターが覚えます。私たちが「駅のベンチで寝ている猫の画像」と指示すると「駅」「ベンチ」「猫」などの画像から学習したデータからコンピューターが新しい画像を作り出してくれます。コンピューターはストックしている多くの画像から1枚を選んで出してくるわけではなく、多くの画像から学習した画像の特徴から新しい画像を「作り出す」のです。

昨今の画像生成AIの進展は拡散モデルという非常に効率的なモデルの応用によって急速に進展し、StableDiffusionのように家庭用のパソコンでも画像生成ができるようになった。最近話題のBingのimage creatorで使えるDALL-E3でも類似の技術が使われているといわれている。

画像生成AIを使ってみる

Bing Image Creator

画像生成AIを知るには実際に使ってみるのが一番です。先日、Bingのimage creatorから高性能なDALL-E3が使えるようになりました。Microsoftのアカウントさえあれば無料で使えます。スマホからでもパソコンからでも使えるので、登録して早速使ってみましょう。下にスマホの画面を示します。自分が作りたい画像を生成するためには作りたいものをプロンプト入力欄に入力するだけです。ここでは試しに、「駅のベンチで寝る猫のパステル調のイラスト」と入力して「作成」ボタンを押します。数秒待つと画像が生成します。

Bingのimage creatorのスマホの画面

画像が生成したスマホの画面

とってもかわいい猫の画像が生成できました。

プロンプトを工夫することで、いろいろな画像を作ることができます。入力するプロンプトを工夫することで、いろいろなシチュエーションの画像を作ることができます。最近、chatGPTの有償版でもDALL-E3での画像生成ができるようになったので、お試しください。

下の画像は「メイド喫茶でパフェを運んでくるかわいい店員, 白黒の少女マンガ, ソロ」で生成した画像です。

StableDiffusion

DALL-E3はお手軽に画像を作れますが、もっと思い通りに好きな画像を作りたくなった方にはStableDiffusionがおすすめです。StableDiffusionは非常に多くの機能があり、それらを使いこなすことにより自分で思い通りの画像を作ることができます。StableDiffusionを使うには高性能のGPU付きのPCを準備したり、環境構築をしたり、初心者にはハードルが高かったのですが、今はオンラインサービス「生成AI GO」でも使えるのでそちらがおすすめです。2週間の無料期間もあり、また、私の過去記事生成AI GOの初月利用料が半額になるクーポンも配布しているので、良かったら使ってみてください。

StableDiffusionでは細かい生成画像のカスタマイズができます。例えば、以下のような機能があります。

・ポーズを指定したり、他の画像の構図を参照した画像の生成
・画風やスタイルの微調整
・画像の一部修正
・画像生成を応用したショートアニメーション作成
・自分の動画を変換したTiktok動画作成
・オリジナルのモデルを使った画像生成

例えば、下の写真の女優さんの写真のポーズを抽出して画像生成をしてみます。

抽出したポーズ(ControlNet openpose)

生成画像(プロンプト:1girl, sweater, skirt, blond long hair, street, town, outdoor)
使用モデル:meinamix_meinaV8

詳しくは私のブログでも紹介していますので、ブログの記事をご参照ください。

Photoshop

Photoshopなど商用アプリにも画像生成AIが搭載されています。ただし、2023年10月現在のモデルでは、単独での生成画像AIの品質はStableDiffusionやDALL-E3のレベルには達していないように見受けられます。ただし、「生成拡張」の機能を使うと、例えば他で作成した画像を横や上に広げたい場合に非常に便利です。上の画像を横に「生成拡張」で広げると下のようになります。

今後、いろいろなツールで画像生成AIは当たり前になってくると思うので、うまく活用できると良いですね。

画像生成AIの活用の可能性

今後もどんどん発展していくと思う画像生成AIですが、うまく活用できたらよいですね。今は画像生成AI単独での使い方がメインのようですが、StableDiffusionのように自分でカスタマイズできるツールを使うことにより、イラストレーターや写真家などのクリエーターの方も部分的に画像生成AIを使ったり、直接は画像生成AIを使わなかったとしても自分の作品の下絵や参考資料としての画像生成AIで生成した画像は参考になると思います。

上でも示しましたが、StableDiffusionとPhotoshopを組み合わせたり、別のツールを組み合わせることによってそれぞれのツールの良いところを使っていくことも良いと思います。

なお、画像生成AIを使うときはそのツールの利用規定の範囲内で、また、著作権などの法規に従って正しくご利用ください。

Stable Diffusion
スポンサーリンク
鷹の目週末プログラマー

コメント