画像生成AIで有名な StableDiffusion(ステーブルデフュージョン)。
バナーつくったりテクスチャつくったり、仕事用にも使いますが、
好きな画像をあれこれ試して生成できるのでいい趣味にもなっています。
StableDiffusionには沢山の呪文(プロンプト)があるので個人的な整理も兼ねて記事にすることにしました。
StableDiffusion モデル
StableDiffusionでいう『モデル』は、画像生成の方向性により様々あり、それぞれ得意分野があるので、思い通りの画像を生成するには『モデル』の選択が最重要です。
例えば日本人女性の画像を作りたいと思えば、
JapaneseDollLikeness(LoRA)
などでググってモデルをインストールするなり選択する必要があります。
モデルのダウンロードサイトも複数ありますが、まずは、「CIVITAI」から見ればいいかなと。
CIVIT AIサイトの中で、 SafeTensorsファイルか、ckpt(チェックポイント) がモデルになりますが、中には追加学習ファイルもあるので要注意。
(インストール方法は割愛)
StableDiffusion プロンプト
本家StableDiffusoin (Stability AI社) が運営するDream Studioでは、プロンプトガイドラインなるものが公開されていて、
コアプロンプト、スタイル、アーティスト、仕上げ(Finishing touches)の4つに分かれていますが、
もうちょい詳しく7つにわけるとよいようで、下記に分けてみました。
StableDiffusionのプロンプト表
項目 | 要素 | 例 |
---|---|---|
1. 品質 | クオリティ | masterpiece, best quality |
2. コアプロンプト | 被写体 | a girl (少女), beautiful forest Landscape (美しい森の風景) |
3. 追加要素 | 小物、ヘアスタイル 衣装、表情 | smart phone, scarf long har, twin tail, pony tail school costume, maid costume smile, looking away, looking at viewer |
4. 背景 | 背景、場所 | black background, white background outdoor, indoor, school, bookstore |
5. スタイル | 油絵、水彩、セル画 | oil painting, watercolor, chibi realistic Concept art, pencil drawing |
6. 構図 | ショットサイズ、アングル | close-up shot, middle shot, long shot, high angle |
7. 照明とフィルタ | ライティング、時間、色 | daylight, moody lighting midnight, midday |
1つめの品質関係のワードは最初に入れることが多く、あとは自由にいろいろ試しながら作ると良さげです。
それぞれについてより詳しく呪文をまとめていきます
StableDiffusionのプロンプト 1. 品質
- best quality 最高品質
- masterpiece 傑作
- detailed 細かい
- ultra detailed さらに細かい
- insanely detailed 最高に精密
- from national geographic
- from artstation
- awatd-winning photograph
- HDR
- FHD
- UHD
- hyper realistic
- 4K, 8K, 16K
- photo realistic
StableDiffusionのプロンプト 2. コアプロンプト
ひとことで言うと主役。メインに持ってきたい単語。 a girlで女の子、background illustration 背景イラスト など。
ここは『ChatGPT』などの文章生成プロンプトに聞いた方がいいかなと思います。
StableDiffusionのプロンプト 3. 追加要素
主役ではないけれど、情景を伝えるために書く要素で、ここをしっかり書くことで思い描く画像に近づいていきます。
人物なら髪型、服装、表情、感情などなど、 背景ならそこに映る人々の様子、建物の特徴、小道具など。
こちらも『ChatGPT』に聞きながら言葉を選んでいけばいいかなと。
StableDiffusionのプロンプト 4.背景
背景はそのまま背景です。
色だけの指定、季節、廃墟、カフェなどなど。こちらも『ChatGPT』で (以下略。
StableDiffusionのプロンプト 5. スタイル
画風を決める要素で、ここを変えることでガラリと雰囲気が変わります。
油絵、アイコン、線画、イラスト、コンセプトアート、サイバーパンク等々。
- 3D render
- icon
- oil painting
- line art
- illustration
- rococo
- concept art
- cyberpunk
- Pablo Picasso style
- cel anime
- chibi anime
- photo, photograph
- hyper realistic
StableDiffusionのプロンプト 6.構図
構図はカメラアングル、ショットサイズ、フレーミングなどにかかわる言葉になります。
最近は『ControlNet』の登場で、これらの言葉を使わなくてもフレーミングの調整ができるようになったようで、追々試していこうと思います。
- High angle shot
- dynamic angle
- full shot
- close-up shot
- two-shot
- POV
StableDiffusionのプロンプト 7. 照明・フィルタ
文字通り明るさやフィルタなどを調整していきます。
- low contrast
- motion blur
- high-key lighting
- volumetric lighting
- shallow depth of field
- deep focus
- monochromatic
- metal texture
実際に作る工程
ちょっとずつ単語を入れて、どんな変化があるかを確認しながら進めるのが一般的です。
少しなれてきたら『ChatGPT』に雰囲気を伝え、単語を出してもらいつつ、その中からピックアップしていくといいかなと。
StableDiffusionのネガティブプロンプト
不要な要素が入らないようにするために、ネガティブプロンプトも重要な要素です。反対呪文という人もいます。
必須ではないけれど書いておくとやり直し回数を減らせれるかなと。
StableDiffusionのネガティブプロンプト1 品質
品質が低いのは出さないでね、というのを伝えることもあります。
- low quality, worst quality
- out of focus
- ugly
- jpeg artifact
- lowres, blurry, bokeh
StableDIffusionのネガティブプロンプト2 nsfw防止
Not safe for workの略で、仕事中に見るには不適切なコンテンツの事を指します。
- nsfw
- nipples
- pubic hair
StableDIffusionのネガティブプロンプト3 作画崩壊、奇形防止
初期設定のまま動かすと、顔が歪んだりするのでその防止策として。
- bad anatomy
- long_neck, long_body
- missing arms, extra_arms, mutated hands
- deformed mutated disfigured
- missing_limb
- liquid fingers
- poorly drawn fingers
- ugly face
- partial face
- cropped
StableDIffusionのネガティブプロンプト4 テキスト、署名のカット
サイン、文字など不要な要素をカットします。
- text
- signature
- watermark
- username
- artist name
- stamp
- title, subtitle
- date
StableDIffusionのネガティブプロンプト5 表情のコントロール
- blush
- open mouth
- make-up
- mascara
- rouge
- half-open eyes
- closed mouth
StableDIffusionのネガティブプロンプト6 作画スタイル・アートスタイル
写真を出したいのに油絵になるとか、その逆とか、雰囲気を特定するためにネガティブに入れることもあります。
- oil painting
- sketch
- watercolor
- 2D
- flat color
StatbleDiffusionよく使うネガティブプロンプト
クオリティ系
low quality, worst quality, out of focus, ugly, error, jpeg artifacts, lowers, blurry, bokeh
奇形防止ワード
bad anatomy, long_neck, long_body, longbody, deformed mutated disfigured, missing arms, extra_arms, mutated hands, extra_legs, bad hands, poorly_drawn_hands, malformed_hands, missing_limb, floating_limbs, disconnected_limbs, extra_fingers, bad fingers, liquid fingers, poorly drawn fingers, missing fingers, extra digit, fewer digits, ugly face, deformed eyes, partial face, partial head, bad face, inaccurate limb, cropped
StableDiffusion 強調プロンプト
カッコで囲むと強調することができます。
- (photo realistic: 1.4)
- (low quality:2)
などなど。
StableDiffusionで生成した画像サンプル
ローカルにStableDiffusion Automatic1111 インストールして、
モデルは JapaneseDollLikeness(LoRA) と ChilloutMix設定して、
サンプラーに DPM++ SDE Karras 設定して、
こんな画像が生成されました。
プロンプトは下記。入力するたびに画像が変わるので、ここをベースに微調整かけていくのいいのかも。
【Positive】
best quality,masterpiece,ultra high res,(photo realistic:1.4),1 girl, medium breasts, cleavage, <lora:japaneseDollLikeness_v10:0.3> ,detailed beautiful face, big blue eyes, brown hair, detailed clothes, casual t-shirt, cute, young, posing, very long hair, looking at viewers, professional lighting, physically-based rendering.
【Negative】
EasyNegative, painting,sketches, (worst quality:2), (low quality:2), (normal quality:2), lowers,normal quality,((monochrome)), ((grayscale)),skin spots,acnes,skin blemishes,age spot, nsfw,ugly face,fat,missing fingers, extra fingers, extra arms,extra legs, watermark, text, error, blurry, jpeg artifacts, cropped,bad anatomy, 2girl
StableDiffusionのプロンプトをまとめてみて
Midjournyが有料になったこともあり、StableDiffusionの注目度がまた増している感があります。
ChatGPTと組み合わせつつ、クオリティや雰囲気なども指定しながら、どんどん試してコツを掴んでいきたいですね。
この記事へのコメントはありません。