WebUIでStable Diffusion 1からの手順

スポンサーリンク
PyTorch
スポンサーリンク

WebUI(AUTOMATIC1111)でStable Diffusionを動かしてみます。比較的軽い環境で動くので、folk版のStable Difuusionしか動かなくても使える可能性はあります。今回は1から導入の手順をまとめました。

参考環境

参考までに今回の導入環境です。

 本体:Dell G5 5590
 スペック:CPU Intel Core i7-9750H メインメモリ 32GB
      GPU NVIDIA GeForce GTX 1660 Ti(6GB)

導入準備

GPU環境の構築

前準備として、GPU環境を構築します。

NVIDIAドライバの更新

下記のNVIDEAのWebサイトから、構成にあった最新のドライバを確認し、インストールします。

PyTorchソフトウエア要件

PyTorchの公式ページからインストール要件を確認します。

今回、2022/12/06現在の安定版であるPyTorch1.13.0をWindows環境にでインストールします。PackageはPip、言語はPythonを用います。CUDAは最新は11.8ですが、まだ、PyTorchが対応していないので、CUDA11.7を入れることにします。

Build Tools for Visual Studio(C++コンパイラ)のインストール

CUDA Toolkitのインストールに先立って、C++のコンパイラを含むBuild Tools for Visual Studioをインストールしておきます。下記から、Build Tools for Visual Studio2022をダウンロードして、インストールします。

「Build Tools for Visual Studio2022」のインストーラーから「C++によるデスクトップ開発」と、左側の「v143ビルドツール用C++/CLIサポート(最新)」にチェックを入れて、インストールします。インストール後、再起動が促されるので、再起動します。

CUDA Toolkit 11.7のインストール

公式ページからバージョンに注意して、今回はCUDA Toolkit 11.7をインストールします。

cuDNNのインストール

公式ページにアクセスし、アカウント作成を行ってログインします。cuDNNは、GPUに対応したニューラルネットワークのライブラリです。プラットフォームとインストールしたCUDA ToolkitのバージョンにあったcuDNNをダウンロードします。

ダウンロードしたファイルは解凍して、適当なところにおいて、その中のbinを環境変数の中の、「ユーザー環境変数」のPATHに追加します。

Pythonのインストール

Pythonをインストールしていない場合は、Pythonをインストールします。バージョンはPython3.10.6が指定されているので、それをインストールします。(Python3.9でも動きましたので、すでにインストールしている場合、近いバージョンなら問題ないかもしれません。)インストールの時にPythonにPATHを通すのを忘れないようにしてください。

Web UIのダウンロード

もし、Gitが入っていなければGitの公式ページからGitをインストールします。

続いて、PowerShellでWebUIインストールしたいフォルダに移動します。そこで、以下のようにコマンドを入れ、WebUIをダウンロードします。

> git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

モデルのダウンロード

Stable Diffusionの学習済みモデルを公開しているページから「ckpt」の拡張子のついているファイルをダウンロードして、インストールしたstable-diffusion-webuiの中のmodelsのフォルダにコピーします。

例えば、Stable Diffusionv1.5なら以下のページからダウンロードできます。

WebUIの起動

WebUIの中の「webui-user.bat」をクリックして起動します。コマンドプロンプトが起動し、以下の画面が表示されたら、「http://127.0.0.1:7960」と書いてある部分をコピーしてChromeのURL欄に貼り付けるとWebUIが起動します。

Embeddings:
Running on local URL:  http://127.0.0.1:7860

To create a public link, set `share=True` in `launch()`.

WebUIを使ってみる

Promptのところに生成したい画像の「呪文」をいれて、Generateボタンを押すと画像を生成してくれます。

関連記事

WindowsネイティブへのCUDA, PyTorchの環境構築
WindowsネイティブへのCUDA、Pytorchの環境構築をまとめます。PyTorchは今機械学習の世界で最も使われているフレームワークの一つです。導入難易度も、TensorFlowよりも低めとのことです。今回はWindowsネイティブへの環境構築を行っていきます。
Stable Diffusion 2で高画質画像生成
Stable Diffusion2での画像生成に挑戦してみます。以前のv1に比べて、高解像度の768x768に対応した新しい安定拡散モデルを用いて、高画質の画像生成が可能になっているそうです。
Stable Diffusionのモデルをローカルに保存
Stable Diffusionのモデルは、デフォルトでは実行時にwebからダウンロードされ、キャッシュに保存されます。2度目以降は、キャッシュから使用されますが、ローカルで安定してStable Diffusionを使用するために、特定の場所に保存する方法をまとめました。
Stable Diffusion Pipelineまとめ(1)text2img
Stable Diffusion Pipelineを公式ページをChatGPTの解説にしてもらいながらかみくだきました。パラメータの意味などをしっかり理解すると生成する画像の意味もよく理解できます。
WindowsでGitとGitHubを使う
WindowsでGitとGit-Hubの基本的な使い方をまとめていきます。Gitは作成したプログラムのソースコードなどの変更履歴を管理するアプリです。Gitでは、それぞれの変更履歴ごとにリポジトリと呼ばれる場所にファイルの状態を保存することによって、バージョンを管理し、複数人での共同作業をやり易くします。一方で、GitHubはGitHub社が提供する世界有数のGitホスティングサービスで、有料の商用プランの他、無料でのリポジトリ環境が提供されている。今回は、GitやGitHubのサービスを利用する上での最低限の知識をまとめてみます。今回は個人でGitとGitHubを使う場合に役立つコマンドを中心にまとめました。

コメント