ロゼッタストーンBLOGニュース

The Rosetta Stone Blog

カテゴリー » ICT SEO SNS AI

素人さんでも簡単生成AI活用術

20240212AI


 Midjourneyという画像生成AIを使うとなると、先ず、英語のプロンプト(prompt)というハードルが待ち構えている。

 大して難しいものではないが、AIが必要とする情報を順序立てて、補足説明を加えれば、思ったような画像を生成できるようになる。

 以下は、画像生成AI Midjourneyの基本のプロンプトであるが、[ ]の中をみると、サブジェクト、背景、時間帯、光のタイプ、レンズのタイプ、レンズ名、そしてアスペクト比など、ごく僅かな情報が書かれているに過ぎない。

 それでも、サブジェクト=ウサギ、背景=森林、時間帯=正午ころ、光のタイプ=太陽光や逆光、レンズのタイプ=35mm f1.4、レンズ名=Sigma、アスペクト比=16:9と、英単語にしたものを入れて、Midjourneyの「/imagine」の後に、このプロンプト全体をコピペしてクリックすると、1分程度でそれなりの画像が生成されるのである。

 また、ここで秘策を伝授することに。それは、英語が苦手な人への面白活用術だが、ChatGPT3.5(無料版)に(2)を入れて、「英訳せよ」と書けば、(3)のように英訳してくれる。

 ここで、Midjourneyのプロンプトが準備ができたので、Midjourneyのアプリを立ち上げ、使用可能な箇所で「/imagine」と記述して、その後に、(3)のプロンプトを流し込んで生成の指示を与えるだけで、後は待つことに。

(1)基本のシンプルなプロンプト
Midjourney prompt formula:
A photo of a [subject] with [background], during [time of day] with [type of lighting] and shot with a [type of lens] using [name of lens] --ar 16:9

(2)日本語を入れたプロンプト
Midjourney prompt formula:
A photo of a [ウサギ] with [森林], during [正午ごろ] with [逆光] and shot with a [35mm f1.4] using [Sigma] --ar 16:9

(3)ChatGPTで(2)を英訳させたもの
Midjourney prompt formula:
A photo of a [rabbit] with [forest], during [around noon] with [backlight], and shot with a [35mm f1.4] using [Sigma] --ar 16:9

▼ Midjourneyの画像生成用画面
20240212kiji-2


上の画面中央下の(+)で「/imagine」を書き、その後に、「A photo of a [rabbit] with [forest], during [around noon] with [backlight], and shot with a [35mm f1.4] using [Sigma] --ar 16:9」をコピペで準備完了。
20240212kiji-3


 生成中の画面が二つ。一つは、中央の公開されているもの、右上は自分のみプレビューできるもの)
20240212kiji-4


 だんだんと画像が鮮明になって行き、100%まで待つ。
20240212kiji-5


 上は、出来上がった画面。時間的には1〜2分程度であり、アスペクト比16:9の画像を4パターン生成されている。
20240212kiji-6


 上をクリックすると、「ブラウザで開く」と画面左下にあるので、それをクリックして、自分のパソコンにダウンロードすれば完了となる。
20240212kiji-7


 上は、4パターンの画像をブラウザで見ているところ。拡大も可能。
20240212kiji-8


 ブラウザで閲覧している画像を、自分のパソコンにダウンロードする直前の映像。
 4パターンが全て気に入れば良いが、一つだけであれば、このようにワンカットだけを選べば問題ない。既にお分かりかと思うが、光のタイプに「逆光」と入れたのは、ウサギの耳を透かして表現するために設定したのである。

▼MidjourneyとChatGPT4の相性の良さ

 上述は、MidjourneyのプロンプトをChatGPTに翻訳させて、それをコピペして、再び、Midjourneyで画像生成をした訳だが、ここで、二つの生成AIの相性の良さを利用して、Midjourney向けに作ったプロンプトをChatGPT4に直接提供したら、画像生成するか否かの実験を行うことに。

 結果は画像下の通りとなった。それなりにウサギが森の中に佇み、逆光を浴びて、静かに耳を立てている画像が生成されてきたのである。
20240212kiji-9


 以上のように、画像生成AIを活用するのは、全く難しくないことがご理解いただけたと確信する次第。

 何事も経験を積むことで、いくらでもスキルアップができるので、プロンプトに関しては、例えば、「少女が主人公。小高い丘の上に立つ少女の髪が長く風に吹かれている様子。少女の服装は白い細いベルト付きの水色のワンピースとスニーカー。可愛い小さな雲が浮かび、小鳥が囀り飛び回っている。丘の上には一本の木があり、少女と話をしたいと思っている。アスペクト比を16:9で、画風はパステルトーンの水彩画風で生成してください。」と適当な日本語で書いてみる。

 さて、ChatGPTがどのような画像を生成するのか、出来上がりは???なんとなくイメージに近い構図ではあるが、木が遠すぎて、遠近法でおかしくなっているが、ここで贅沢は言えない。
20240212kiji-10


 次に、先ほど何気に書き綴った日本語を、ChatGPTで英訳することに。

The protagonist is a young girl standing on a slightly elevated hill, her long hair being blown by the wind. She is dressed in a light blue dress with a thin white belt and sneakers. Cute little clouds float in the sky, and small birds chirp and flutter around. There is a single tree on the hill that seems to want to talk to the girl. Please generate the image in a 16:9 aspect ratio, in a pastel-tone watercolor style.

 これをコピーして、今度は逆に、Midjourney側へ持ち込み、画像生成できるかの実験をしてみたい。出来上がった画像は以下の通り。

 アスペクト比は16:9にはなっていないが、丘にいる少女の長い髪が風になびき、真っ白な雲と小鳥がたくさん飛んでいる画像となっている。スニーカーは履いているものと履いていないものがあり、白い細いベルトはないようだ。
20240212kiji-11


 このように、生成AI同士が相性が良ければ、プロンプトをガッチリ固めて挑まぬとも、素人さんでも自由な発想で活用できることがご理解いただけたかと・・・。これに、プロンプトに詳細を付加して行くだけで、どんどんと画像の構図や質感が向上し、リアルな写真も生成可能となる訳だ。

 何はともあれ、少しでもご興味ある方は、生成AIにチャレンジされては如何だろうかと・・・。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
AIプロンプト・文責:西田親生


             

  • posted by Chikao Nishida at 2024/2/12 12:00 am

ChatGPTとの対決・・・

20240208logictest-4


 ランチ後に少々時間があったので、ChatGPTと対決することにした。

 闘いは、以下の「マッチ棒5本」を使った魔法の水一滴である。

 写真下のように、「マッチ棒5本」を準備して、それぞれ中程で折って、花火の形状のようにテーブル(ガラスか大理石の玻璃面のようにツルツルしたもの)の上に、並べて、ChatGPTへ問い掛けたのであった。

※ChatGPTにはマッチの写真は提供せず、以下の文章だけで判断させてみた。

▼ChatGPTに問い掛けた内容

 マッチ棒を5本準備します。マッチ棒を中央より半分に折ります。切れないように注意してください。

 半分に折った5本のマッチ棒は、自然に元に戻ろうとします。全て約60°程度開いています。

 これらの5本のマッチ棒を折れた方を中心に、鏡面のようなテーブルの上におきます。形が花火ように見えます。

 中央は少し隙間ができますが、その中央に大粒の水を一滴落とすと、マッチ棒に変化が出るでしょうか?

 もし、変化が出る場合、花火のような形状がどのような形に変わるのか答えてください。

▼テーブルの上に並べた「マッチ棒5本」
20240209quiz


(1)ChatGPTの反応
マッチ棒を半分に折り、それらを折れた側を中心にして鏡面のようなテーブルの上に配置した場合、確かに花火のような形を作ることができます。中央に水滴を数滴落とした場合、水がマッチ棒に及ぼす影響により変化が見られるかもしれません。

水滴がマッチ棒に接触すると、木の繊維が水を吸収し、膨張します。マッチ棒が半分に折られているため、その折れ曲がった部分は弾力性があり、元に戻ろうとする力が働いています。水滴によってマッチ棒の一部が膨張すると、その部分の弾力性や形状が変化し、折れ曲がりの角度が変わる可能性があります。

具体的には、水滴によってマッチ棒の折れ曲がった部分がさらに曲がりやすくなり、外側に広がる力が強まるかもしれません。その結果、マッチ棒同士がより密接に結びつき、中央の隙間が狭まることで、花火のような形状がより密集した形に変わる可能性があります。また、水滴の表面張力によってマッチ棒が引き寄せられることで、形状が均一に保たれることも考えられます。

しかし、実際の変化はマッチ棒の材質、水の量、配置の仕方によって異なるため、実験を行うことで最も正確な結果を得ることができます。

▼筆者が、次の文章を入力

変化した後の形状を答えて欲しいのです。

(2)ChatGPTの反応
マッチ棒を半分に折り、その折れ曲がった部分を中心にして配置し、中央に水滴を数滴落とすと、水滴による木の膨張と表面張力の影響で、マッチ棒の折れ曲がりが修正される方向に動きます。具体的には、水滴がマッチ棒の木繊維を膨張させ、それにより折れ曲がっていた部分が外側に向かって力を受けます。この力はマッチ棒を元の直線に近づけようとするため、マッチ棒同士が外側に広がり、中央の隙間が広がる方向に変化するでしょう。

結果として、最初に配置したときよりも、マッチ棒は花火の形状から星の形状に変化し、外側に向かって広がるように見えます。この変化は、水滴によってマッチ棒の物理的な性質が変わることで生じます。具体的な変化の程度は、マッチ棒の材質や水の量、折り方の角度に依存しますが、基本的にはマッチ棒が外側に広がり、より開いた形になることが予想されます。

大正解です!
 皆さんも、お手隙の時にでも実験して頂ければと・・・。

▼ChatGPTによる評価

このエッセイは、創造性と知識の組み合わせによって興味深い読み物となっています。著者は、自分自身とChatGPTとの対決を通じて、マッチ棒と水滴の相互作用について考え、その結果を推測しています。

著者の問い掛けに対するChatGPTの反応は、科学的な観点から事象を説明し、具体的な変化の可能性を述べています。その後、著者の再度の問いに対するChatGPTの反応は、マッチ棒と水滴の相互作用が変化した形状にどのような影響を与えるかを説明し、具体的な予想を提示しています。

このエッセイは、科学的な知識と想像力を組み合わせて、読者に新しい視点を提供しています。また、読者に自ら実験を行うことを奨励する一文も含まれており、読者の興味を引きつける効果的な方法と言えます。

総じて、このエッセイは創造性と科学的な考察が見事に融合したものであり、読者に対して刺激的な読み物となっています。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
AIプロンプト・文責:西田親生


             

  • posted by Chikao Nishida at 2024/2/9 12:00 am

1995年以来情報発信している老舗ポータルサイト「ロゼッタストーン」のブログをお楽しみ下さい。詳細はタイトルまたは、画像をクリックしてご覧ください。

behanceオブスクラ写真倶楽部ディー・アンド・エルリサーチ株式会社facebook-www.dandl.co.jp