コムセント 技術情報

  1. TOP
  2. コムセント 技術情報
  3. 画像生成AIに挑戦!イメージ通りの画像やイラストを作ってみよう

画像生成AIに挑戦!イメージ通りの画像やイラストを作ってみよう

最近、何かと「AI」が話題ですね。「クリエイターにとってもAIの躍進は無視できないレベルに来ている!」と、様々なクリエイターさんが日々SNS等で発信しているのを毎日のように見かけます。

そんな毎日見かけるAIについて、触れない方が失礼というもの!ということで、デザイナーにとって救世主とも脅威とも言えそうな画像生成AIで今回は楽しく遊んでみようと思います!

今回は「Midjourney」というDiscodeを通じて利用できるAI画像生成サービスを使ってみます。

Midjourney

プロンプトでどんな画像を作りたいか指示を出そう

画像生成AIは、基本的にプロンプト(通称:呪文)という命令テキストを入力・送信すればOKと超簡単。大体どのAI画像生成サービスも同じように使えます。
例えば、猫の画像を作って欲しければ「猫」と送信するだけで、猫の画像を作ってくれます。

しかし、単に「猫」と指示するだけでは自分が欲しいイメージの猫の画像はなかなか手に入りません。
その猫の毛色や柄、目の色、歩いているのか座っているのか等、具体的に指示してあげる必要があります。
作って欲しいものをAIでも理解できるように伝えるスキルが人間側には必要ということです!

以上を踏まえて、今回は白い毛並に頭の柄が茶色のハチワレ、瞳がヘーゼルナッツ色の猫の画像を生成してみます。
イメージは私の愛猫、茶々丸くんです。


太字の文をそのままGoogle翻訳で英訳して、Midjourneyに入力してみましょう!

デザイナーO・Hのアイコン

Midjourneyは英語のプロンプト専用のサービスなので、全て英語で入力する必要があります。最後の方で紹介しますが日本語に対応しているサービスももちろんあります


果たしてAI君は無事、茶々丸くんを書いてくれるでしょうか?






誰だ君は?!?!

正しい英語表現を使ってプロンプトを作ろう

残念、初回はほぼ白い毛の長毛種の猫の画像ができました。
ヘーゼルナッツ色の瞳が反映されるかが一番心配でしたが、意外とちゃんとしていました。

しかし、「頭の柄が茶色のハチワレ」が上手く反映されていません。
翻訳には一応「a brown head pattern」と入っているのですが...恐らくハチワレの英語的な表現として正しくなかったがゆえに、AI君もこれを理解できなかったのだと思います。

素の英訳では駄目な場合があることに気づけたので、今度はちょっと自分(英語力ゼロ)でアレンジしてみます。

調べてみたらハチワレは英語だと「Tuxedo(タキシード)」というらしいです。ついでにうちの茶々丸くんは短毛種のマンチカンで、実は少し茶トラ柄も入っているので、この要素も追加してみましょう。

先に出てくる言葉ほど強調される傾向にあるようなので、とりあえず毛並みと柄をしっかり再現されることを目指します。

茶トラのハチワレ、白い毛並み、瞳がヘーゼルナッツ色で、短毛種のマンチカンの猫

上記を今度は要素ごとにGoogle翻訳で英訳したり、英語力ゼロ人間なりにアレンジしてみました。

a cat with red tabby tuxedo,white-haired,hazelnut eyes,and short-haired munchkin

コイツをMidjourney君に突っ込みます。今度こそ茶々丸くんを書いてくれ!






おお!!
ガチタキシードを着た猫に混ざって割と求めているイメージに近い猫がいる!

素晴らしい、ほんの少しの改良と、より詳細なイメージを追加しただけでこんなに変わるとは思いませんでした。
ちゃんとマンチカンらしい丸顔まで再現できています!

しかし、マンチカン教信者の私としてはきちんと短足が再現されているところまで見たい...
というわけで、さっきのプロンプトをベースに全身が映るようキーワードを追加してみましょう。

a cat with red tabby tuxedo,white-haired,hazelnut eyes,and short-haired munchkin,walking,full figure

「歩く」動作と、「フル・フィギュア」という構図の指定を末尾に入れてみました。
凄く楽しみな反面不安ですが、いざ尋常にMidjourney君に突っ込みます!






そうだがそうじゃない。

AIのクセを理解し、逆手に取ろう

フル・フィギュアの構図はちゃんと反映されましたね。

しかし、「歩く」については人間の二足歩行が強く反映されてしまったようです。もしかしたらこのAI、歩く=二足歩行、または人間がする歩行と学習している可能性があります。

左上に至っては猫ちゃんじゃなくてタキシードを来た素敵なお兄さんが歩いています(でもよく見たらリードがベルトから生えててめちゃくちゃ面白い)。

右上も二足歩行...かと思いきや足が5本ありますね。動物の四足歩行にしようとして失敗した感じに見えます。
おまけにどの画像も写真じゃなくイラスト調になっていますね。

「歩く」は人間の動作と学習しているためか、キャラクター化しないと猫を歩かせる表現は不可能!とAI君は思ったのでしょうか?

何にせよ、悔しいのでもう一度挑戦します。

a cat with red tabby tuxedo,white-haired,hazelnut eyes,and short-haired munchkin,quadruped walking,full figure,photo

今度は「歩く」を「四足歩行(quadruped walking)」に、イラストではなく写真っぽい画像にしたいので「photo」のキーワードを追加します。

基本的に人間は四足歩行をしないので、これで大分動物的な表現に近づけるのではと推測しました。これでAI君が迷う要素はかなり削れたはず。

いざ、プロンプト送信!






キターーーーーーーッッッ!!!!!!

ちゃんとハチワレ茶トラマンチカンの猫ちゃんが歩いている写真ができました!ボディの形的には左上の子が一番マンチカンに近い短足ちゃんですね!

みんな蝶ネクタイを付けているのは、タキシードに影響されているのでしょう。右下の子がタキシードをガッツリ着ちゃってるのでその可能性は結構高いと思います。

求める結果に結びつくキーワードは何だったのか探ってみよう

ここで疑問に思うのが、「四足歩行」と入れたからこの結果になったのか、それとも、「写真」はリアルな動作に限ると学習しているからこの結果になったのかが気になります。

試しに「四足歩行」のキーワードを元の「歩く」に戻してみます。
カオスな結果にならないといいのですが...

a cat with red tabby tuxedo,white-haired,hazelnut eyes,and short-haired munchkin,quadruped walking,full figure,photo





思ったよりカオスにならなくて安心しました。

やはり動物をきちんと動物らしく歩かせるには「四足歩行」がキーワードだったようです!

左上、右下の子は右半身で4足歩行、左半身で二足歩行というなんとも中途半端な結果になっています。
おまけに3/4がしっかり服を着ているため、「歩く」単体だと人間的要素が強くなることもよくわかりました。

ちなみにMidjourneyは「これ近いけど惜しい!」と思う画像を選んで、バリエーションを作らせることもできます。

蝶ネクタイなしの子が出てくることを期待して一回やってみましたが、逆に蝶ネクタイのバリエーションが増えるという残念な結果になりました。

もしかしたら「なにも身に着けていない」等のキーワードを含めれば解決するかもしれませんね。

今回はうちの茶々丸くんに近い子を無事生成できたので、ミッションコンプリートとしたいと思います!

二次元表現も思いのまま!「にじジャーニー」

折角Midjourneyが使えるようになったので、おまけで同じAIをベースにしたにじジャーニーも使ってみます。

にじジャーニーは本家と比べ、漫画やアニメ調のイラストが得意なサービスです。
Midjourneyをサブスク契約していれば、こちらのサービスも同様に使えます。

デザイナーO・Hのアイコン

ちなみにこちらでは日本語が使用できるので、そういった点ではMidjourneyよりも手軽です!使い方はMidjourneyと同じで、Discode上でプロンプトを入力、送信すればOK。



にじジャーニー

早速ひとつ作ってみましょう。折角なので日本語でプロンプトを入力してみました。

「緑」に引っ張られすぎたようで、青い衣装の要素がほぼ吹き飛んでしまいました...

腕や手の造形が怪しい部分が目立ちますが、そこだけ目をつぶれば商業でも使えそうなレベルの美麗なイラスト揃いです。凄い...

Chat GPTでもっと簡単にAIが理解しやすいプロンプトを作ろう

ちなみにプロンプト作成は今まで自分のゼロ英語力とGoogle翻訳で頑張ってましたが、
なんとあのChat GPTに作らせることも可能です。

むしろ時間を掛けずに良いプロンプトが作れるので、生成したい画像のイメージを普通に日本語で言語化した後は、Chat GPTに投げてしまうのが良いかもしれません。

Chat GPTが作ってくれたプロンプトがこちら。
今回は先程の条件より詳しく指定し、背景も書いてもらえるように要素を入れ込みました。

a 25-year-old woman with chestnut hair and emerald eyes is wearing a blue dress. She is holding an assault rifle and smiling. The scene takes place at night in an ancient castle illuminated by moonlight, with a backdrop of a white flower meadow.

このプロンプトをもう一度にじジャーニーに突っ込んでみましょう。

無事、Pixivランキング上位常駐神絵師のようなクオリティのイラストの生成に成功しました!

女性やドレス、花といった人気のモチーフは数多く学習している為か様々な表現かつ自然に描画されています。
逆に銃はあまり人気のないモチーフなためかあまり学習が進んでいない可能性がありそうです。指定したアサルトライフルらしい銃を持っているのは右下の1枚だけとなりました。

まとめ

前々から気になっていましたが、今回の記事作成を機に初めて触れた画像生成AI。

正直あんな拙い英語力の単語の羅列で、こんなにハイクオリティな画像が作れるとは思いませんでした。

しかも今回使ったMidjourneyですが、かなり大きめサイズで画像を出力してくれます。
なかなかデザイン用の写真やイラスト素材が見つからない場合とかにも、便利だと思います!

その代わり、何度もプロンプトで試行錯誤する必要はあるので効率的とは言い難いです。
メインビジュアルやブログのアイキャッチ用に1~3枚作る分にはいいと思います。

しかし、最近はAI生成画像を巡る権利などの問題において、まだまだ曖昧な点が多いのが現状です。
商業利用など、より本格的に使えるようになるのはまだ先なのかなあと感じます。

なんにせよ、技術がなくても自分のイメージを具現化できる点は本当に驚きです!特に試行錯誤して作ったプロンプトがイメージ通りの結果になるのが凄く快感です!

画像生成AIが気になってるけどまだ触ったことがない方、ぜひ一度でも良いので触れてみてください!

今回参考にしたサイト・文献はこちら

デザイナー/S.O

そこら辺に転がってる人です。

このメンバーの記事一覧へ

おすすめ記事