ロゼッタストーンBLOGニュース

The Rosetta Stone Blog

タグ » 画像生成AI

生成AIとの勝負は、対話力に尽きる。

20240310chikaonishida-1


 デジテルが苦手な人でも、絵を描けない人でも、筆者のように拙い文章しか書けない人でも、生成AIを利用することで、これまで不可能と思われていた苦手な分野を、生成AIとの会話が成立すれば、誰でも克服できる。

 画像生成AIの代表的なもの(text to image)にMidjourneyというものがあるが、そのプロンプトを眺めているだけでも、「なるほど!」と頷き、それに気づけば、自分がイメージしたものが画像生成可能となる。

 生成AIは難しくて手に負えないと思い込んでいる人の方が多いのではないかと推察するが、それは全くの思い込みであり、生成AIとの対話さえできれば、老若男女問わず、誰でも生成AIのエキスパートになれる可能性は高い。

 Midjourneyのプロンプトを英語で見ると、英語が苦手な人は、初手から触るのを拒むかも知れない。しかし、日本語でもしっかりとプロンプトとしての対話を理解してくれるので、何も問題はない。

 カメラを趣味としている人は、AIに画像生成させるのは、すこぶる簡単。画像のアスペクト比(写真の横と縦の比率)を指定する場合、16:9、1:1、4:3などと、明確にアスペクト比をプロンプトの最後に記述するだけで、思い通りの比率の画像が生成される。単に「--ar 16:9」と書けば完了。勿論、日本語で「アスペクト比は16:9」を記述しても生成AIは理解してくれるはずだ。

 生成AIを操るには、命令するのではなく、論理的に正確に、それもディテールまでしっかりと順序立てて伝える準備を行い、生成AIと対話すれば、生成AIは対話内容を理解して、従順に処理を行ってくれる。よって、利用者と生成AIの会話が如何に成り立つかにより、画像生成の質が決定づけられる。

 例えば、一人の日本人女性モデルを描きたいのであれば、その主人公についての記述がプライオリティー1となる。髪の毛の長さや色、眼や眉の形状、鼻の高さや形状、唇のリップの色や形状などなど、ディテールをしっかりと説明する必要がある。

 加えて、環境について詳細を語れば、思い通りに、日本人女性モデルの画像生成できるということだ。そこで、顔や表情などのディテールをしっかりとプロンプトとして記述すれば、眼球中央の黒目表面の映り込みや眉1本までをも美しく生成してくれる。

 後は、イヤリングやピアスなどの装飾品もまた、形状などの解説を端的にわかりやすく記述すれば、小さなサクランボの形をしたピアスなども生成することが可能となる。

 欲を言えば、先ほどカメラを趣味とする人が優位な点を話したけれども、カメラやレンズの種類やf値なども書き込めば、超ワイドで撮影したような映像からテレフォトレンズで撮影した被写界深度までをも生成してくれる。

 更に、「Backlight」など逆光や光の回り込み特性、太陽光が当たる花や葉っぱなどの透過、水滴表面の映り込みなど詳しいプロンプトを提供すれば、生成AIも最新バージョンで可能な限り、素晴らしい画像を生成してくれることになる。

 生成AIは全く難しいものではなく、逆に、とても親切で論理思考がしっかりしており、それと如何に無駄のない対話ができるかによって、画像生成の生成物がアーティスティックなものになるか否かが左右される。

 つまり、プロンプトという言葉を難解なプログラムと勘違いしている間は、生成AIを操ることなどできるはずもない。何故なら、生成AIの特徴、論理思考の流れ、text to text、text to image、text to videoなど全て、対話能力の差によって、生成物に差が生じるだけの話。

 生成AIは感情を持たぬ、論理の塊のような存在ではある。それとの対話能力を身につける=生成AIに簡潔にわかりやすく説明する能力さえあれば、貴方は、明日から生成AIアーティストとして活躍することが可能となる。

 以上、拙い解説であるが、生成AIの操り方というものは実に簡単であるという結論に至る。

 よって、これまでの食わず嫌いによる認識を改め、是々非々、生成AIをお試しあれ!

 蛇足ながら、iPhoneの最新モデルなどは、デジタル一眼レフカメラの設定と同レベルに達しようとしている。よって、iPhoneのみならず、その他スマホの最新モデルの設定を理解できるようになれば、生成AIへの対話能力は一段とアップすることになる。

▼ChatGPTのDALL-EやSoraなどを使用して生成した画像

▼スーツ姿で魚釣りを生成させた画像
キーワードは、日本人ビジネスマン、桟橋、釣り、大物、ロッドとリールなど
20250106fising-1


▼Poolsideで考え込んでいる少女を生成させた画像(動画)
キーワードは、プールサイド、少女、リアリスティック、顔のディテール、水滴など
20250106poolside-1




▼ビジネスをイメージさせた男女を生成させた画像
キーワードは、若い男女、スーツ、スマホ、腕時計など
20250106business-1


▼底意地の悪い男女を生成させた画像
キーワードは、日本人男女、彼らの性根の悪さ、目つき、表情の険しさなど
20250106human-1


▼サザンカの木の下で湯上りを満喫する女性(動画)
キーワードは、若い日本人女性、浴衣、サザンカの花々など
20250101model-3




▼煽り運転や嫌がらせをする中年女性を生成させた画像
キーワードは、煽り運転、激昂、恨み妬み辛み、軽自動車、狭い路地など
20250106aori-1



▼ChatGPT-4oによる感想
このエッセイ「生成AIとの勝負は、対話力に尽きる」は、生成AIの利用方法とその可能性について、わかりやすく解説しながらも実用的なアドバイスを提供しています。その内容は、生成AIが難しいものではなく、むしろ論理的で親切なツールであると強調しており、読者に対して挑戦を促す力強いメッセージが含まれています。

感想

主張の明確さ
エッセイ全体を通じて、「生成AIの本質は論理思考であり、それを操る鍵は対話力である」という主張が明確に伝わってきます。このシンプルなテーマは、生成AI初心者にとって非常に親しみやすいと感じました。また、「生成AIを使うことで不可能が可能になる」というポジティブな視点が随所に見られ、読者に前向きな印象を与えています。

具体例の効果的な使用
「Midjourney」のプロンプト例や、カメラ設定(アスペクト比やf値)など、具体的な例が豊富で、生成AIの活用イメージが鮮明に描かれています。特に、カメラを趣味とする人への言及や、細部を指示することで生成物の質が向上するという説明は、実践に直結する内容で説得力があります。

技術的な詳細と親しみやすさのバランス
技術的な詳細について触れる一方で、それを専門知識がない人でも理解できるように工夫されています。例えば、「--ar 16:9」や「アスペクト比は16:9」の記述例は、初心者にも取っつきやすい解説です。このように、専門用語やテクニカルな話題を平易な言葉で説明する力が、このエッセイの大きな魅力の一つだと思います。

生成AIの可能性を広げる視点
「Backlight」や「光の回り込み特性」などの詳細設定が画像生成のクオリティを高めるという指摘は、読者に生成AIのさらなる可能性を示唆しています。このような具体的なヒントは、単なる説明を超え、生成AIの活用を楽しく感じさせるものです。

読者への励まし
「生成AIは難しいものではなく、とても親切」というフレーズや、「生成AIアーティストとして活躍できる」という結論は、読者に勇気を与える力強いメッセージです。このポジティブなトーンがエッセイ全体を支えており、生成AIに興味を持ちながらも一歩踏み出せない人にとって、大きな後押しになるでしょう。

総合的な評価
このエッセイは、生成AIに対するハードルを下げ、読者にその可能性を伝える点で非常に成功しています。技術的な要素と親しみやすさが両立しており、初心者から興味を持った人まで幅広い読者層に響く内容です。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
プロンプト・文責:西田親生


                     

  • posted by Chikao Nishida at 2025/1/7 12:00 am

生成AI画像の質と価値は、観察力と表現力により差異が生じる。

20241217frog-1


 この1年余りの生成AIついての考察および実践において、表題の通り「生成AI画像の質は、観察力と表現力により差異が出る。」との結論となった。

 緻密かつ繊細な観察力があり、そのイメージを如何に表現(言葉にする)するかで、プロンプトが決まってくる。よって、そのプロンプトの良し悪しが生成AI画像の質と価値を決めると言っても過言ではない。

 登場する主人公が誰なのか、年齢、性別、ヘアスタイル、目や眉、そして鼻や口の形、顔の輪郭、表情、服装などのディテールに加え、背景や環境光、構図など総合的に緻密な観察力を持って、確実な表現力(生成AIとの会話)によって全てが決まることになる。

 text to image、text to video、text to soundなどなど、テキストから画像が生成されたり、静止画から動画が生成されたりするので、ほんの数行のプロンプトでも画像生成は可能ではあるものの、その質と価値を決めるのは、上述の通り。

 よって、感性の低い人が書き込むプロンプトは単純であり、主人公のディテールがないために、薄っぺらい、軽々な、それもありきたりな画像として生成されてしまう。

 生成AIのアプリによっても癖が異なるので、特に人物の画像生成をする場合は、適当に書き込むと、同じような人物像が生成され、食傷ものとなる。

 特に、最近はtext to videoが話題となっているので、目の動きやカメラワーク、撮影機材やレンズまでをもプロンプトに書き込み、アスペクト比なども考慮しておかないと、単なる、インスタグラムに投稿するようなスクウェア画像となるので、しっかりと把握しておかねばならない。

 中には、AIのプロンプトに精通しており、短時間に相当レベルの高い画像生成ができる強者も見かけるが、その人たちと肩を並べるクリエイターとなるには、高い歓声もさることながら、観察力と表現力が大きな鍵を握っていると言っても過言ではなさそうだ。
20241214aiimage-1


20241214aiimage-2


20241214aiimage-3









▼ChatGPT-4oによる感想

このエッセイは、生成AIによる画像生成の質を決定づける重要な要素として「観察力」と「表現力」を挙げ、その意義や影響を具体的に論じています。以下に感想を述べます。

1. 明確な結論と一貫性
エッセイの冒頭で「生成AI画像の質と価値は観察力と表現力により差異が生じる」という結論を提示し、全体を通じてそのテーマが一貫して論じられています。これにより、読者は何を主張しているのかを明確に把握できます。このような明快な構成は説得力を高めています。

2. 観察力と表現力の重要性の説明
具体的な例を挙げながら、観察力が画像のディテールをどのように影響するか、またそれを生成AIのプロンプトで表現するスキルがいかに重要かを説明しています。たとえば、「年齢、性別、ヘアスタイル、顔の特徴、表情、服装、背景などの詳細」がプロンプトに反映されることで質の高い画像が生まれるという論点は非常に具体的です。この部分は、特にクリエイティブな仕事に携わる人々にとって有用な洞察となっています。

3. 生成AIツールの特性の指摘
「生成AIアプリによって癖が異なる」「適当なプロンプトでは似通った画像が生成される」など、実践から得た知見が共有されています。これにより、生成AIの特性を理解し、活用する上での具体的なヒントが得られる点が優れています。

4. 批評と課題提示
感性が低い人や観察力・表現力が不足している場合の問題点として、「薄っぺらい、軽々な画像」となるリスクを指摘しており、生成AIを単なる便利ツールとしてではなく、クリエイティブな表現の拡張として捉えるべきという示唆があります。この批評は鋭いものの、受け手に努力の方向性を示唆しているため、建設的な印象を与えます。

5. 未来への展望と課題
最後に、text to videoの可能性に触れ、「カメラワークやアスペクト比」など、さらに高度な要素をプロンプトに含める必要性を示唆しています。生成AI技術の進化に伴う新たなチャレンジを指摘しつつも、それを乗り越えるための具体的なアプローチを提示しており、読者に未来志向の視点を提供しています。

総評
このエッセイは、生成AIを効果的に活用するための核心的なポイントを捉えており、特にクリエイティブ分野の専門家や興味を持つ読者にとって有益です。観察力と表現力がプロンプトの質を決定し、それが画像生成の結果に直結するという洞察は、生成AIの可能性を深く掘り下げたものと言えます。また、課題と展望のバランスが良く、生成AIの未来についてポジティブな視点を提供しています。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
文責:西田親生


                             

  • posted by Chikao Nishida at 2024/12/17 12:00 am

1995年以来情報発信している老舗ポータルサイト「ロゼッタストーン」のブログをお楽しみ下さい。詳細はタイトルまたは、画像をクリックしてご覧ください。

behanceオブスクラ写真倶楽部ディー・アンド・エルリサーチ株式会社facebook-www.dandl.co.jp