鷹の目週末プログラマー

ウエイトで微調整するLoRAを使ってみる

マイナスのウエイトで話題になっているflat LoRAなどの画質微調整系のLoRAを使ったみました仕上げの部分で使える強力なLoRAモデルです。是非使いこなせるようになりたいものです。

2023.06.02

Stable Diffusion

Adobe Photoshop betaのジェネレーティブ塗りつぶしを体験してみる

Adobe Photoshop betaで画像生成の機能が追加された。Stable Diffusionなどの生成系AI技術をウォッチしている身としては使ってみるしかないということで、早速話題の「ジェネレーティブ塗りつぶし」を使ってみました。今回の記事では１からPhotoshopを使って、AIツールを使うところまでをやってみます。Photoshop betaやfireflyを使ってみたい方はご参考ください。

2023.05.25

Stable Diffusion

Stable Diffusion WebUIが起動しなかったり、動作がおかしくなった時の対処法

これまでは使えていたStable Diffusion WebUIですが、起動しなくなったり、一部機能が使えなかったり、ドライブやフォルダを移動したりして動作がおかしくなった時の対処法を示します。せっかく入れたモデルや拡張機能などをそのままにできるので、動作がおかしい時はお試しください。

2023.05.22

Stable Diffusion

アニメ絵から実写系画像の生成：reference only + tile resample

アニメ絵を高精度の実写系画像に変換してみます。実写系画像では出しにくいコスチュームやシチュエーションもアニメ絵なら出しやすいケースがあります。そういうときは一旦アニメ絵で出したあと、multicontrolnetでreference onlyとtile resampleを併用して、高精度の実写系モデルを生成できます。今回は実写系で大人気のBrav5モデルを使ったアニメ絵を実写画像に変換してみます。

2023.05.20

Stable Diffusion

Stable Diffusionを始めるのに最適なGPU搭載おすすめPC（パソコン工房編）

Stable Diffsionを始めるにはローカル環境でするのがおすすめです。ここでは、BTOパソコンメーカーのパソコン工房のPCでStable DiffusionをするのにおすすめなPCをご紹介します。今やStable Diffusionだけではなく、各種AIやゲーム制作や作曲、オンラインゲームなど一台でいろいろなことができる高機能PCを将来への投資のために買っておくのは良いのではないでしょうか。

2023.05.17

Stable Diffusion

reference only+mov2movで安定動画生成：Stable Diffusion WebUI ControlNet

mov2movで動画を作成する場合、なかなか安定した動画を作るのが難しいという問題点がありました。動きに合わせて生成される動画が一定にならず、結構カチャカチャした動きが多くなってしまいます。そこで、先日ControlNetに実装されたreference onlyを適用して動画を作成してみました。

2023.05.16

Stable Diffusion

reference only Controlで学習なしで好きなキャラを出す：Stable Diffusion ControlNet拡張機能

先日、ControlNetに新しく追加されたReference-onlyを使うと、簡単に好きなキャラクターの画像を生成することができます。これまで、出したいキャラクターを出そうと思ったら、LoRAなどで学習させて、LoRAモデルを作成し、それを使って生成するのが王道でした。今回、LoRAを使わずに好きなキャラクターを生成してみます。

2023.05.16

Stable Diffusion

領域を指定してプロンプトを効かすLatent Couple ：Stable Diffusion WebUI拡張機能の効果検証

領域を指定してプロンプトを効かすLatent Couple extensionの機能を検証します。Latent Couple extension拡張機能は、例えば、二人の人物を生成したいときに、それぞれの服装や髪型などを指定したいときに効果を発揮する強力なツールです。

2023.05.13

Stable Diffusion

音声変換の革命RVCで自分の声を自然な女性の声にしてみる：ローカル環境構築

音声変換技術RVCを使って自分（男性）の声を自然な女性の声にしてみたいと思います。今回はRVC変換の環境をWindowsローカルで作って、録音した自分の声の変換したいと思います。今回は公開されている学習済みモデルを使いますので、声のデータを集めたり、学習させたりは必要ありません。手軽に試せるので、ぜひ皆さんもお試しください。

2023.05.07

音声合成

進化したControlNet1.1のレビュー（Stable Diffusion Web UI）

ControlNetがバージョン1.1になりました。大きく機能が追加されましたので、まずはどんなことができるか全モデルの確認していこうと思います。新しい機能が追加されたり精度があがったり、完成度がどんどん高くなってきています。

2023.05.03

Stable Diffusion

Stable Deffusion WebUIの環境ライブラリ更新

Stable Diffusion WebUIが今週更新されました。この更新により標準ライブラリがtorch2.0.0とxfomers0.0.17に変更になっています。一概に最新バージョンが良いわけではありませんが、今後、新しいバージョンをベースに機能改善されていくことから、適当なタイミングでアップデートをしていきましょう。

2023.05.03

Stable Diffusion

mov2movでTiktokの動画を生成する：Stable Diffusion WebUI拡張機能

mov2movでAI美女に踊らせてみました。元動画は私（おっさん）ですが、Stable Diffusionのmov2movにかかると、そんな私でも美女の踊ってみた動画が作れます。おっさんを美女に変換するという少し無茶なことをやっていますので、ちらつきが大きいです。

2023.04.30

Stable Diffusion

Stable Diffusionで引きの画像で顔をきれいに出す方法の研究（Hires. fix＋LLUL）

Stable Diffusionで人物の全身を出した時、顔が崩れて違和感があることがあります。ここでは画像の顔をなるべくきれいに出す方法を研究しました。好みの問題もありますが、Hires. fixやLLULをうまく使うことで顔をきれいに出すことができました。

2023.04.29

Stable Diffusion

Sadtalker拡張機能でStable Diffusionで音声に合わせて会話する動画を作成

Stable Diffusionの進化が止まりません。Sadtalker拡張機能を使うことで、Stable DiffusionのWebUIで何と画像がしゃべる動画を作成できます。ここでは、Sadtalkerのセットアップから使用方法まで丁寧に解説します。

2023.04.24

Stable Diffusion

Stable Diffusion WebUIのControlNetのm2mでショート動画を作ってみた

Stable DiffusionのWebUIのControlNetのm2m（movie to movie）を使ってショート動画を作ってみました。ちょっとまだ精度に問題はありますが、動きのあるアニメーションも簡単に作れてしまうのは感動です。

2023.04.23

Stable Diffusion

ノートPCでStable Diffusion WebUIをローカル環境で使う方のためのおすすめ外付けGPU

Stable Diffusionをローカル環境で使うためにはNVIDIA製のGPUがほぼ必須です。高性能のノートPCを持っているのにGPUがないためにStable Diffusionが使えないが、新しくデスクトップPCを買わずに済ましたい方に向けてWindowsノートPC用のおすすめの外付けGPUを紹介します。

2023.04.16

Stable Diffusion

Stable Diffusion WebUIを日本語化

Stable Diffusion WebUI Automatic1111の拡張機能をインストールして日本語化する方法をまとめました。日本語化することで、WebUIの機能が分かりやすくなりますね。

2023.04.16

Stable Diffusion

xFormersでStable Diffusion WebUI高速化・省メモリ化

xFormersはフェイスブック（現メタ社）の開発者が開発したライブラリで、Transformerに最新のコンポーネントを取り入れることにより、従来より高速でメモリ効率の高い計算を実現します。Stable DiffusionでもxFormersを有効化することにより、画像生成速度やメモリ消費量を抑制することができる可能性があります。ここでは、xFormersの有効化を効果を検証します。

2023.04.09

Stable Diffusion

CPUでStable Diffusion WebUI、Automatic1111を使う

Stable Diffusionを使うにはNVIDIA製GPUがほぼ必須ですが、そういったPCが用意できない場合、CPUでもローカルの環境構築は可能です。ここではCPUでのインストールを行ってみます。

2023.04.07

Stable Diffusion

LoRA追加学習で画風を再現

LoRAによりStable Diffusionのモデルに画風の追加学習してみます。あらかじめターゲットとする画風の画像での追加学習により、Stable Diffusionで好みの画風の画像を生成できるようになります。今回もKahya_ssの...

2023.04.05

Stable Diffusion

Automatic1111のwebui.batを読み解く：Windowsのバッチファイル解析

Stable Diffuisionのwebui、Automatic1111のwebui.batの記述内容を理解して、このバッチファイルの中でどんな処理が行われているか確認してみました。バッチファイルはどのように動いているか理解することで、実...

2023.04.02

Stable Diffusion

LoRA追加学習で好きなキャラ召喚：Stable Diffusion WebUIでの画像生成

Stable DiffusionのWebUI Automatic1111用に追加学習によりLoRA学習モデルを作成します。追加学習の方法はいろいろありますが、比較的低スペックのPCでも対応可能なLoRAを実施します。手軽に自分の欲しい画像が出せるのは素晴らしいですね。今回は、東北ずん子様を学習データに用いたLoRAの生成をしてみます。

2023.03.26

Stable Diffusion

WebUIのTagger拡張機能で画像のタグ付け

Stable Diffusion WebUI、Automatic1111のTagger拡張機能の使用方法をまとめました。LoRAでの学習用データへのタグ付けにも便利な拡張機能です。特にベースをWD14にしているため、WD1.5でのLoRA作成と相性が非常に良いです。

2023.03.20

Stable Diffusion

WD1.5 Beta2+WebUI+ControlNetで高画質画像生成環境構築

WD1.5 Beta2はStable Diffusion2.1をベースにアジア圏の実写やアニメ1500万枚以上から学習した高画質な画像が生成できるモデルです。これまでの多くのモデルは、NovelAIからリークしたモデルを含んでいる可能性もあるとも言われ、倫理上問題があるといわれていました。一方、WD1.5モデルはStable Diffusion2.1をベースとして、新たに学習し直したモデルであり、本モデルは、「the Fair AI Public License 1.0-SD」の元、自由な使用が許諾され、商用利用も認められています。今回、WD1.5 BetaとAUTOMATIC1111のWebUI、ControlNetを組み合わせて、高画質の生成環境を構築していきます。

2023.03.11

Stable Diffusion

Stable Diffusion WebUI、AUTOMATIC1111のアップデート方法

Stable Diffusion WebUI、AUTOMATIC1111を最新版にアップデートする方法をまとめます。バグ修正や機能追加などでAUTOMATIC1111が更新されることもありますので、必要に応じてアップデートを実施します。

2023.03.11

Stable Diffusion

Depth library拡張機能でStable DiffusionのWebUIで思い通りの手を生成

Stable Diffusionの弱点の一つは、思い通りの指を作ることです。なかなか思い通りの指の形にならないとき、Depth libraryに登録された手を使うと思ったような画像を簡単に生成できます。ここでは、Depth library拡張機能をインストールして、拡張機能にデフォルトで入っている各種の手のDepthを使って画像修正をしてみます。

2023.03.11

Stable Diffusion

ControlNetなどのWebUI拡張機能を最新版に更新する方法

Stable DiffusionのWebUIでポーズを指定した画像生成ができるControlNetは頻繁に更新されています。今回は現在のControlNetなどのWebUIの拡張機能を最新版に更新する方法をまとめます。

2023.03.09

Stable Diffusion

WD1.5 Beta 2+Web UIで高画質アニメ絵生成環境構築

高画質のStable Diffusion2.1をベースにアジア圏の実写やアニメ1500万枚以上から学習したモデルWD1.5 Beta 2を使ったWebUIでの画像生成環境をWindowsのローカル環境に構築してみます。プロンプトで簡単に高画質なアニメ画像が生成できます。

2023.03.06

Stable Diffusion

生成系AIを使うためのGPU搭載おすすめパソコン

Stable Diffusionなどの生成系AIをローカル環境で使うにはGPUを搭載したパソコンがほぼ必須です。ここでは、私の経験からStable Diffusionなどの生成系AIを楽しむためのおすすめのパソコンのスペックについて説明します。

2023.03.04

Stable Diffusion

ウエイトで微調整するLoRAを使ってみる

Adobe Photoshop betaのジェネレーティブ塗りつぶしを体験してみる

Stable Diffusion WebUIが起動しなかったり、動作がおかしくなった時の対処法

アニメ絵から実写系画像の生成：reference only + tile resample

Stable Diffusionを始めるのに最適なGPU搭載おすすめPC（パソコン工房編）

reference only+mov2movで安定動画生成：Stable Diffusion WebUI ControlNet

reference only Controlで学習なしで好きなキャラを出す：Stable Diffusion ControlNet拡張機能

領域を指定してプロンプトを効かすLatent Couple ：Stable Diffusion WebUI拡張機能の効果検証

音声変換の革命RVCで自分の声を自然な女性の声にしてみる：ローカル環境構築

おすすめの公開RVCモデル

進化したControlNet1.1のレビュー（Stable Diffusion Web UI）

Stable Deffusion WebUIの環境ライブラリ更新

mov2movでTiktokの動画を生成する：Stable Diffusion WebUI拡張機能

Stable Diffusionで引きの画像で顔をきれいに出す方法の研究（Hires. fix＋LLUL）

Sadtalker拡張機能でStable Diffusionで音声に合わせて会話する動画を作成

Stable Diffusion WebUIのControlNetのm2mでショート動画を作ってみた

ノートPCでStable Diffusion WebUIをローカル環境で使う方のためのおすすめ外付けGPU

Stable Diffusion WebUIを日本語化

xFormersでStable Diffusion WebUI高速化・省メモリ化

CPUでStable Diffusion WebUI、Automatic1111を使う

LoRA追加学習で画風を再現

Automatic1111のwebui.batを読み解く：Windowsのバッチファイル解析

LoRA追加学習で好きなキャラ召喚：Stable Diffusion WebUIでの画像生成

WebUIのTagger拡張機能で画像のタグ付け

WD1.5 Beta2+WebUI+ControlNetで高画質画像生成環境構築

Stable Diffusion WebUI、AUTOMATIC1111のアップデート方法

Depth library拡張機能でStable DiffusionのWebUIで思い通りの手を生成

ControlNetなどのWebUI拡張機能を最新版に更新する方法

WD1.5 Beta 2+Web UIで高画質アニメ絵生成環境構築

生成系AIを使うためのGPU搭載おすすめパソコン