ロゼッタストーンBLOGニュース

The Rosetta Stone Blog

タグ » 画像生成AI

ChatGPTの集中研究に切り替える・・・

20240515ChatGPT-1


 これまで、Midjourneyやその他の生成AIをtext to imageの実証実験として活用してきたが、筆者の仕事柄、これからはChatGPTオンリーに絞り、集中研究することにした。

 text to text、text to image、text to movieと本年末を目処に、遥かに進化するであろうChatGPTでもあり、生成AIの牽引役として膨張しつつあり、それだけでも十分研究対象となり得る。また、他の生成AIの登録解除をしても、全く支障はないと判断したのである。

 ほとんどの生成AIはサブクスとなっており、1日で活用できる時間を逆算すると、非効率な仕事環境を作ってしまっていたことになり、今回の判断は間違いはないと確信している。

 ただ、先々は生成AI戦争が現在とは比較にならぬほど激化するために、他の生成AIの動向もしっかりと見据えておく必要がある。勿論、いつでも登録解除から復帰するのは簡単なことなので、それよりも、今は、AppleのiCloudのグレードアップを優先する方が賢明であろうかと。

chatgpt20240121-12


▼ChatGPT-4oによる感想

筆者は、これまで様々な生成AIを利用してきましたが、今後はChatGPTに絞って研究を進めることを決意しています。理由としては、ChatGPTがtext to text、text to image、text to movieと多岐にわたる進化を遂げており、十分に研究対象として価値があると考えているからです。また、複数の生成AIを利用することが非効率であることにも気づき、その見直しを図っています。

この決断には合理性があります。生成AIの技術は急速に進化しており、特定の技術に集中することで、より深く理解し、効果的に活用できるでしょう。また、サブスクリプションモデルのサービスを複数利用することは、時間やコストの面で非効率になることも理解できます。

さらに、筆者は将来的な生成AIの競争激化を見据え、他の技術の動向も注視する必要性を認識しています。これにより、必要に応じて柔軟に対応できる準備ができるでしょう。

iCloudのグレードアップを優先するという判断も、データ管理やバックアップの重要性を考慮した賢明な選択です。クラウドサービスの充実は、生成AIの活用をよりスムーズにするための基盤となるからです。

総じて、このエッセイは筆者の生成AIに対する戦略的なアプローチと、効率的な研究環境を整えるための工夫が伺えます。今後の研究成果に期待が持てる内容です。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
プロンプト・文責:西田親生


                     

  • posted by Chikao Nishida at 2024/5/18 12:00 am

素人さんでも簡単生成AI活用術

20240212AI


 Midjourneyという画像生成AIを使うとなると、先ず、英語のプロンプト(prompt)というハードルが待ち構えている。

 大して難しいものではないが、AIが必要とする情報を順序立てて、補足説明を加えれば、思ったような画像を生成できるようになる。

 以下は、画像生成AI Midjourneyの基本のプロンプトであるが、[ ]の中をみると、サブジェクト、背景、時間帯、光のタイプ、レンズのタイプ、レンズ名、そしてアスペクト比など、ごく僅かな情報が書かれているに過ぎない。

 それでも、サブジェクト=ウサギ、背景=森林、時間帯=正午ころ、光のタイプ=太陽光や逆光、レンズのタイプ=35mm f1.4、レンズ名=Sigma、アスペクト比=16:9と、英単語にしたものを入れて、Midjourneyの「/imagine」の後に、このプロンプト全体をコピペしてクリックすると、1分程度でそれなりの画像が生成されるのである。

 また、ここで秘策を伝授することに。それは、英語が苦手な人への面白活用術だが、ChatGPT3.5(無料版)に(2)を入れて、「英訳せよ」と書けば、(3)のように英訳してくれる。

 ここで、Midjourneyのプロンプトが準備ができたので、Midjourneyのアプリを立ち上げ、使用可能な箇所で「/imagine」と記述して、その後に、(3)のプロンプトを流し込んで生成の指示を与えるだけで、後は待つことに。

(1)基本のシンプルなプロンプト
Midjourney prompt formula:
A photo of a [subject] with [background], during [time of day] with [type of lighting] and shot with a [type of lens] using [name of lens] --ar 16:9

(2)日本語を入れたプロンプト
Midjourney prompt formula:
A photo of a [ウサギ] with [森林], during [正午ごろ] with [逆光] and shot with a [35mm f1.4] using [Sigma] --ar 16:9

(3)ChatGPTで(2)を英訳させたもの
Midjourney prompt formula:
A photo of a [rabbit] with [forest], during [around noon] with [backlight], and shot with a [35mm f1.4] using [Sigma] --ar 16:9

▼ Midjourneyの画像生成用画面
20240212kiji-2


上の画面中央下の(+)で「/imagine」を書き、その後に、「A photo of a [rabbit] with [forest], during [around noon] with [backlight], and shot with a [35mm f1.4] using [Sigma] --ar 16:9」をコピペで準備完了。
20240212kiji-3


 生成中の画面が二つ。一つは、中央の公開されているもの、右上は自分のみプレビューできるもの)
20240212kiji-4


 だんだんと画像が鮮明になって行き、100%まで待つ。
20240212kiji-5


 上は、出来上がった画面。時間的には1〜2分程度であり、アスペクト比16:9の画像を4パターン生成されている。
20240212kiji-6


 上をクリックすると、「ブラウザで開く」と画面左下にあるので、それをクリックして、自分のパソコンにダウンロードすれば完了となる。
20240212kiji-7


 上は、4パターンの画像をブラウザで見ているところ。拡大も可能。
20240212kiji-8


 ブラウザで閲覧している画像を、自分のパソコンにダウンロードする直前の映像。
 4パターンが全て気に入れば良いが、一つだけであれば、このようにワンカットだけを選べば問題ない。既にお分かりかと思うが、光のタイプに「逆光」と入れたのは、ウサギの耳を透かして表現するために設定したのである。

▼MidjourneyとChatGPT4の相性の良さ

 上述は、MidjourneyのプロンプトをChatGPTに翻訳させて、それをコピペして、再び、Midjourneyで画像生成をした訳だが、ここで、二つの生成AIの相性の良さを利用して、Midjourney向けに作ったプロンプトをChatGPT4に直接提供したら、画像生成するか否かの実験を行うことに。

 結果は画像下の通りとなった。それなりにウサギが森の中に佇み、逆光を浴びて、静かに耳を立てている画像が生成されてきたのである。
20240212kiji-9


 以上のように、画像生成AIを活用するのは、全く難しくないことがご理解いただけたと確信する次第。

 何事も経験を積むことで、いくらでもスキルアップができるので、プロンプトに関しては、例えば、「少女が主人公。小高い丘の上に立つ少女の髪が長く風に吹かれている様子。少女の服装は白い細いベルト付きの水色のワンピースとスニーカー。可愛い小さな雲が浮かび、小鳥が囀り飛び回っている。丘の上には一本の木があり、少女と話をしたいと思っている。アスペクト比を16:9で、画風はパステルトーンの水彩画風で生成してください。」と適当な日本語で書いてみる。

 さて、ChatGPTがどのような画像を生成するのか、出来上がりは???なんとなくイメージに近い構図ではあるが、木が遠すぎて、遠近法でおかしくなっているが、ここで贅沢は言えない。
20240212kiji-10


 次に、先ほど何気に書き綴った日本語を、ChatGPTで英訳することに。

The protagonist is a young girl standing on a slightly elevated hill, her long hair being blown by the wind. She is dressed in a light blue dress with a thin white belt and sneakers. Cute little clouds float in the sky, and small birds chirp and flutter around. There is a single tree on the hill that seems to want to talk to the girl. Please generate the image in a 16:9 aspect ratio, in a pastel-tone watercolor style.

 これをコピーして、今度は逆に、Midjourney側へ持ち込み、画像生成できるかの実験をしてみたい。出来上がった画像は以下の通り。

 アスペクト比は16:9にはなっていないが、丘にいる少女の長い髪が風になびき、真っ白な雲と小鳥がたくさん飛んでいる画像となっている。スニーカーは履いているものと履いていないものがあり、白い細いベルトはないようだ。
20240212kiji-11


 このように、生成AI同士が相性が良ければ、プロンプトをガッチリ固めて挑まぬとも、素人さんでも自由な発想で活用できることがご理解いただけたかと・・・。これに、プロンプトに詳細を付加して行くだけで、どんどんと画像の構図や質感が向上し、リアルな写真も生成可能となる訳だ。

 何はともあれ、少しでもご興味ある方は、生成AIにチャレンジされては如何だろうかと・・・。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
AIプロンプト・文責:西田親生


             

  • posted by Chikao Nishida at 2024/2/12 12:00 am

1995年以来情報発信している老舗ポータルサイト「ロゼッタストーン」のブログをお楽しみ下さい。詳細はタイトルまたは、画像をクリックしてご覧ください。

behanceオブスクラ写真倶楽部ディー・アンド・エルリサーチ株式会社facebook-www.dandl.co.jp