MENU
  • About概要
  • Exhibition展示会
  • Seminarゼミ資料
  • Column雑談
  • Contactお問い合わせ
AICG Seminar | For Students Starting AI,CG
  • About概要
  • Exhibition展示会
  • Seminarゼミ資料
  • Column雑談
  • Contactお問い合わせ

知識ゼロからの【Stable Diffusion Web UI】#2 これだけでも十分使える基礎知識

2024 3/02
2024-03-02

世界一乱暴な画像生成AIの使い方ページはここです。

このページは「乱暴な説明でもよいのでとりあえず画像生成AIを体験したい」という方を対象に進めます。細かい説明や難しい知識は可能な限り省略して、まずは画を生成することに集中します。

前回のページで皆さんは、Stable Diffusion Web UIを使用して画が生成できるようになりました。
このページでは、プロンプトや各設定を使って、画像を調整する基礎的な方法を習得します。

Contents

プロンプト(Prompt)を理解する

プロンプト(prompt)とは

プロンプト(prompt)は、AIに対してどのような画像を生成してほしいかを伝えるためのテキスト指示です。

プロンプトの書き方

  • 英語で記述します。
  • 明確かつ具体的に記述します。AIは提供された情報をもとに画像を生成するため、詳細が多いほど望む結果に近づきます。
  • 先頭(上)に書かれているプロンプトから優先して実行されます。
  • 75トークン(単語)を越えないようにします(画面右上)。
  • 異なる表現や詳細度でプロンプトを変更し、複数のプロンプトで実験して最適な結果を導き出します。
  • 要素をバランス良く組み合わせることで、望む画像の全体像をAIに伝えます。

プロンプトの構成する4つの要素

主題

  • “a serene lake surrounded by mountains” (山に囲まれた静かな湖)
  • “an old library filled with books” (本でいっぱいの古い図書館)
  • “a futuristic cityscape at dusk” (夕暮れ時の未来都市の風景)
  • “a sunset over the ocean” (海上の夕日)
  • “a cat sitting on a window sill” (窓辺に座る猫)
  • “a bustling city street at night” (夜の賑わう都市の通り)

スタイル

  • “rendered in a pixel art style” (ピクセルアートスタイルでレンダリング)
  • “like a Van Gogh painting” (ゴッホの絵画のように)
  • “mimicking a Renaissance masterpiece” (ルネサンスの傑作を模倣して)
  • “in the style of impressionism” (印象派のスタイルで)
  • “digital watercolor painting” (デジタル水彩画)
  • “vibrant anime illustration” (鮮やかなアニメ風イラスト)

属性

  • “glowing neon signs” (光るネオンサイン)
  • “a reflection on the water surface” (水面の反射)
  • “shadows cast by the setting sun” (沈む夕日によって投げられた影)
  • “vivid colors” (鮮やかな色彩)
  • “detailed textures” (詳細なテクスチャ)
  • “dynamic lighting” (ダイナミックな照明)

品質

  • “masterpiece” (傑作)
  • “best quality” (最高品質)
  • “4K resolution” (4K解像度)
  • “high resolution” (高解像度)
  • “ultra-detailed” (超詳細)
  • “soft focus background” (背景ぼかし効果)
  • “with a cinematic depth of field” (映画のような奥行きのあるフィールドで)
  • “portrait mode with bokeh effect” (ボケ効果のあるポートレートモードで)

人物を描かせる場合は、人種、年齢、服装(色や質感)、ポーズ、表情など詳細な説明を記述します。

ネガティブプロンプト(Negative Prompt)を理解する

ネガティブプロンプト(Negative Prompt)とは

ネガティブプロンプト(Negative Prompt)は、生成したい画像から排除したい要素をAIに伝えるために使います。不要な要素を効果的に排除しながら、理想に近い画像を生成します。

ネガティブプロンプトの単語

  • “no watermark” (透かしなし): 生成される画像に透かしマークを含めないよう指示します。
  • “avoid borders” (枠線を避ける): 画像の周囲に枠線が追加されるのを防ぎます。
  • “exclude text” (テキストを除外): 画像内にテキストが含まれないようにします。

EasyNegativeを活用する

前回のページでEasyNegativeという機能をインストールしました。EasyNegativeは、Negative Promptを簡単に設定できる機能です。特に初心者にとって、不要な要素を排除するための単語を一から考えるのは難しい場合があります。EasyNegativeを使用すると、一般的に除外したい要素をプリセットから選択して追加できます。勿論その他のネガティブプロンプトとの併用も可能です。

AICG Seminar | For Students Star…
知識ゼロからの【Stable Diffusion Web UI】#1ノートPCで画像生成を体験しよう | AICG Seminar | For Stu… 世界一乱暴な画像生成AIの導入ページへようこそ このページは「乱暴な説明でもよいのでとりあえず画像生成AIを体験したい」という方を対象に進めます。細かい説明や難しい…

プロンプトまとめ

 プロンプトの記述欄は2種類あり書いてほしい内容、書いてほしくない内容をそれぞれの記述欄に詳しく記述します。

プロンプトの内容で絵の品質が大きく変化する為、とても大事な要素です。極める為には更に詳細に学ぶ必要があります。しかし今回は初心者のためのページということで細かいことは後回しにして、画像生成していきます。

画や3DCGを学ぶ皆さんは画像を元に画像を生成、コントロールするimg2img(後述)をおすすめします。

あわせて読みたい
知識ゼロからの【Stable Diffusion Web UI 】#3 画像から画像を生成しよう 世界一乱暴な画像生成AIの使い方ページはここです。 元画像 img2img生成画像 このページは「乱暴な説明でもよいのでとりあえず画像生成AIを体験したい」という方を対象…

とりあえず画像を生成してみよう

最初はプロンプトのみで生成してみる

 まずはデフォルトの状態からプロンプトのみを入力して、その後他のパラメーターも変更して、生成される画像の違いを見ていきたいと思います。
生成したい画像の内容を指示するプロンプトを入力します。この時点で、画像に含めたい要素をできるだけ詳細に記述します。

今回はこのようなプロンプトを入力して画像を生成します。
単語と単語の間は”,”(カンマ)で区切ります。

an old library filled with books,vibrant anime illustration,detailed textures,dynamic lighting,high resolution,ultra-detailed

次に、生成したくない要素をNegative Prompt欄に入力します。

EasyNegative

今回もEasyNegativeを使用します。この機能を利用することで、Negative Promptの入力が簡単かつ迅速に行えます。

画像の生成と評価

プロンプトとNegative Promptの設定が完了したら、「Generate」ボタンをクリックして画像の生成を開始します。

生成画像

思った絵にならなかった場合は試行錯誤のタイミングです。生成された画像と元のプロンプトを比較し、必要に応じてプロンプトを調整します。プロンプトの具体性を高める、不要な要素を排除するNegative Promptを追加するなどのフィードバックを反映させましょう。

[ Seed ] の値=ランダム要素

生成された画像フォルダ(Outputs/日付)内のPNGファイルの名前にも注目してください。

この「1760237783」という番号がこの画像のSeedの値です。
試しにSeedの値に「1760237783」という番号を入力して、もう一度Generateをクリックします。

Stable Diffusion Web UIは全く同じ画像を生成しました。

Seedの値が画像生成のランダム(ガチャ)要素に関わっている。
Seed -1 で画像を生成(Generate)すると、毎回異なるSeed値で画像が生成されます。

複数生成したい場合は [ Batch count ]

Seedを-1(ランダム状態)に戻しBatch countを9に変更し画像を生成(Generate)します。

異なるSeed値の画像が9枚生成されました。左がWebUIの画面ではサムネイルで出力され、下部の小さいアイコンで一枚一枚確認できます。右側はOutputsフォルダの状況です。Batch countで画像を連続生成することが出来、アイデアのバリエーションを生成するのに役立ちます。画像(アイデア)を大量に生成することが出来る強力な組み合わせです。

[ Sampling method ] は質感に関係するパラメーター

Sampling methodも、画像生成プロセスのランダム性を制御するために使用され生成画像が変化します。
具体的な方法としては、異なるサンプリング手法を選択し、生成される画像の多様性や品質に影響を与えることができます。使用するサンプリング方法によって、画像の細部の表現やテクスチャが変わります。効果的な使い方をするには、目的に応じてサンプリング方法を選択し、最適な結果を得るための実験を重ねることが重要です。

下記はSeed値を1760237783に固定して
Sampling methodを変更した画像です。

DPM++ 2S a
DPM++ SDE
DPM adaptive
DPM++ 2S a Karras
DPM++SDE Karras
DDIM

[ Sampling Steps ] の機能と使い方

Sampling Stepsとは

AIが画像を生成する際に行う反復計算の回数を指します。この数値を増やすことで、プロンプトよって指定された目標に近づけ、高品質の画像を生成します。

Sampling Stepsの設定

Sampling steps 10
画像に alt 属性が指定されていません。ファイル名: 00004-4143663842.jpg
Sampling steps 20
Sampling steps 30
Sampling steps 40
Sampling steps 50
Sampling steps 60

Sampling Stepsの数を調整して、異なる結果を得ます。ステップ数を10から10ずつ増やし60まで計算した結果です。画像はより詳細になる可能性がありますが、生成に要する時間も長くなります。参照画像では、40あたりで要素が安定し、60ではほぼ変化しなくなることがわかります。

画像を大きく生成する [ Hires fix ]

  • Hires fixとは: 画像を大きく拡大して生成してくれる機能です。

「Hires fix」のチェックボックスにチェックを入れ、機能を有効にします。 を押して、プルダウンメニューを表示させます。Upscale by が倍率です。画面では2倍(512*512から1024*1024)に拡大生成します。

Hires fixは生成過程で画像が大きく改変されたり品質を維持するのに知識が必要なので、私はあまりお勧めしません。今回は紹介だけにとどめます。初心者が画像を大きくしたい場合はimg2imgでの拡大や拡張機能のUltimate SD Upscaleをお勧めします。

知識ゼロからの【Stable Diffusion Web UI 】最大16倍!Ultimate SD Upscaleで画像を拡大する

それでも試してみたいあなたは下記のパラメーターから微調整してみることをお勧めします。
Denoising strength を下げると元画像を尊重してくれます。

Upscaler:R-ESRGAN 4x+ Anime6B
Hires steps:20
Denoising strength :0.25
Upscale by:2

PNG Infoから画像の生成情報を読み込む

過去に生成したPNG画像がどのようなパラメーターだったのか知りたい場合はPNG Infoのタブを使用します。

生成されたPNG画像はパラメーター記憶しています。その情報を読み込む機能です。

確認したい画像をドラッグ&ドロップ(クリックして選択)します。

右側にパラメーター(生成された時の状況)が記述されます。

parameters

an old library filled with books,vibrant anime illustration,detailed textures,dynamic lighting,high resolution,ultra-detailed
Negative prompt: EasyNegative,worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,
Steps: 60, Sampler: DPM++ 2S a Karras, CFG scale: 7, Seed: 1760237783, Size: 1280×720, Model hash: fbcd9b9cc3, Model: blue_pencil-v7


こちらのパラメーターをtxt2imgで使いたい場合は
[ Send to txt2img ]をクリックします。

[ txt2img ] タブに移動します。
プロンプトやパラメーターが再現できているのが確認できます。
勿論[ Generate ] をクリックすることで同じ画像が生成可能です。

今回のまとめ

2種類のプロンプト(Prompt)を理解しました。
[ Seed ] の値でランダム要素を確認して、
[ Batch count ]で大量のアイデアを生成できることを理解しました。
[ Sampling method ] で画像の質感を変更しました。
[ Sampling Steps ] で画像の質を向上させました。
最後にPNG Infoを使って、画像のパラメーターを確認しました。
駆け足でしたが、これらを使いこなすことで十分画像生成を楽しめますし、今後のさらなる試行錯誤の手掛かりとなるはずです。次回は画像を使用した生成方法について話します。

Stable Diffusion
AUTOMATIC1111 prompt Stable Diffusion Web UI 使い方 初心者

コメントする コメントをキャンセル

Contents
  1. ホーム
  2. ゼミ資料
  3. Stable Diffusion
  4. 知識ゼロからの【Stable Diffusion Web UI】#2 これだけでも十分使える基礎知識
Contents