ロゼッタストーンBLOGニュース

The Rosetta Stone Blog

タグ » sora

生成AI画像の質と価値は、観察力と表現力により差異が生じる。

20241217frog-1


 この1年余りの生成AIついての考察および実践において、表題の通り「生成AI画像の質は、観察力と表現力により差異が出る。」との結論となった。

 緻密かつ繊細な観察力があり、そのイメージを如何に表現(言葉にする)するかで、プロンプトが決まってくる。よって、そのプロンプトの良し悪しが生成AI画像の質と価値を決めると言っても過言ではない。

 登場する主人公が誰なのか、年齢、性別、ヘアスタイル、目や眉、そして鼻や口の形、顔の輪郭、表情、服装などのディテールに加え、背景や環境光、構図など総合的に緻密な観察力を持って、確実な表現力(生成AIとの会話)によって全てが決まることになる。

 text to image、text to video、text to soundなどなど、テキストから画像が生成されたり、静止画から動画が生成されたりするので、ほんの数行のプロンプトでも画像生成は可能ではあるものの、その質と価値を決めるのは、上述の通り。

 よって、感性の低い人が書き込むプロンプトは単純であり、主人公のディテールがないために、薄っぺらい、軽々な、それもありきたりな画像として生成されてしまう。

 生成AIのアプリによっても癖が異なるので、特に人物の画像生成をする場合は、適当に書き込むと、同じような人物像が生成され、食傷ものとなる。

 特に、最近はtext to videoが話題となっているので、目の動きやカメラワーク、撮影機材やレンズまでをもプロンプトに書き込み、アスペクト比なども考慮しておかないと、単なる、インスタグラムに投稿するようなスクウェア画像となるので、しっかりと把握しておかねばならない。

 中には、AIのプロンプトに精通しており、短時間に相当レベルの高い画像生成ができる強者も見かけるが、その人たちと肩を並べるクリエイターとなるには、高い歓声もさることながら、観察力と表現力が大きな鍵を握っていると言っても過言ではなさそうだ。
20241214aiimage-1


20241214aiimage-2


20241214aiimage-3









▼ChatGPT-4oによる感想

このエッセイは、生成AIによる画像生成の質を決定づける重要な要素として「観察力」と「表現力」を挙げ、その意義や影響を具体的に論じています。以下に感想を述べます。

1. 明確な結論と一貫性
エッセイの冒頭で「生成AI画像の質と価値は観察力と表現力により差異が生じる」という結論を提示し、全体を通じてそのテーマが一貫して論じられています。これにより、読者は何を主張しているのかを明確に把握できます。このような明快な構成は説得力を高めています。

2. 観察力と表現力の重要性の説明
具体的な例を挙げながら、観察力が画像のディテールをどのように影響するか、またそれを生成AIのプロンプトで表現するスキルがいかに重要かを説明しています。たとえば、「年齢、性別、ヘアスタイル、顔の特徴、表情、服装、背景などの詳細」がプロンプトに反映されることで質の高い画像が生まれるという論点は非常に具体的です。この部分は、特にクリエイティブな仕事に携わる人々にとって有用な洞察となっています。

3. 生成AIツールの特性の指摘
「生成AIアプリによって癖が異なる」「適当なプロンプトでは似通った画像が生成される」など、実践から得た知見が共有されています。これにより、生成AIの特性を理解し、活用する上での具体的なヒントが得られる点が優れています。

4. 批評と課題提示
感性が低い人や観察力・表現力が不足している場合の問題点として、「薄っぺらい、軽々な画像」となるリスクを指摘しており、生成AIを単なる便利ツールとしてではなく、クリエイティブな表現の拡張として捉えるべきという示唆があります。この批評は鋭いものの、受け手に努力の方向性を示唆しているため、建設的な印象を与えます。

5. 未来への展望と課題
最後に、text to videoの可能性に触れ、「カメラワークやアスペクト比」など、さらに高度な要素をプロンプトに含める必要性を示唆しています。生成AI技術の進化に伴う新たなチャレンジを指摘しつつも、それを乗り越えるための具体的なアプローチを提示しており、読者に未来志向の視点を提供しています。

総評
このエッセイは、生成AIを効果的に活用するための核心的なポイントを捉えており、特にクリエイティブ分野の専門家や興味を持つ読者にとって有益です。観察力と表現力がプロンプトの質を決定し、それが画像生成の結果に直結するという洞察は、生成AIの可能性を深く掘り下げたものと言えます。また、課題と展望のバランスが良く、生成AIの未来についてポジティブな視点を提供しています。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
文責:西田親生


                             

  • posted by Chikao Nishida at 2024/12/17 12:00 am

動画生成AI「Sora」の登場でCF業界は?

20241212cat-4


 発表されたばかりの動画生成AI「Sora」の実験を試みた。一言で、空恐ろしいほどのパワーを感じたのである。

 まだ、数本の動画を生成したに過ぎないが、これまでCF業界にも関わってきたので、その生成画像精度の高さと、プロンプト次第では、十分、CF業界で活用されるものであると確信する次第。

 筆者がプロンプトを入力し、生成された動画の中でも、ヒヨコと子ネコの動画の尺は僅か5秒間であるが、最初の子ネコの視点に違和感があるだけで、子ネコの猫パンチを交わしながらヒヨコが足を出し、子ネコが近づき、ぺろっと舐めて距離を詰めるところなど、実に面白い。

 温かみのある藁の上での一コマだが、この動画が僅か数十秒にて生成されるのだから、驚きである。よって、いろんなカットを合わせて15秒、20秒ほどの尺で作れば、簡単にCFは完成する。動画エディタやエフェクタを使用し、カットを繋げるだけで、完璧なCFの完成となる訳だ。

 従来は、実写であれば、それなりにロケをしたり、スタジオを使って、高度な映像を創造しなければならなかったのが、デスク上のパソコン画面を見ているだけで、どうにでも創れるのだから、これまでのデジタル世界が急変する。

 プロダクションも戦々恐々としているところ、逆に、これ幸いに、動画生成AIを用いて、短時間に、それも、想像を絶するような動画制作の可能性を突き詰めれば、これまでとは全く異なるCF世界が見え隠れするに違いない。

 後は、マテリアルとなる動画が揃えば、エディタやエフェクタを使い、音響も立体音響などで仕上げれば、臨場感あるCFが無限に創造できることになるのだから、毎月$200のプロ仕様の料金が、大手プロダクションとしては、お安いものになる。

 これから遅かれ早かれ、動画生成AIが本格始動し、従来のプロダクション以外に、個人的にスキルを持った人たちが、わんさとAIに取り憑かれる時代が到来したようだ。

 結局は、イマジネーションの闘いとなるCF業界なので、後は、人間が如何に動画生成AIを使いこなすのかに掛かっている。

 デジタルの進化は、プロフェッショナルの世界を加速度を上げて狭めてきたことは周知の事実。しかし、諄いようだが、生成AIを使いこなすか否かで、その勝負は決まる。

 最後に、生成された画像の著作権問題、倫理性など、悪質なフェイク画像とならぬよう、早急に法的整備へ向かい、すべての人たちが見識高く、健全なるデジタル世界構築に努力しなければならない。

▼Sora実験:20241212 ヒヨコ&ネコ


▼Sora実験:20241213 少女


▼ChatGPT-4oによる感想

このエッセイは、動画生成AI「Sora」の登場がCF(コマーシャルフィルム)業界に与える衝撃と可能性を、具体例を交えて描写しつつ、技術的、倫理的な側面にも言及しています。以下に、感想と考察を述べます。

感想と考察

1. AI技術の進化とCF業界への影響
エッセイは「Sora」が持つ動画生成能力の具体例として、ヒヨコと子ネコの動画を挙げています。このシーン描写は具体的かつ視覚的で、AIがいかにリアルな映像を短時間で生成できるかを効果的に伝えています。また、これにより従来のプロダクションの制作プロセスが劇的に簡略化されることを述べており、読者に「デスクトップだけでCF制作が可能になる」という大きな変化を実感させています。

2. 動画生成AIの可能性と課題
動画生成AIの利点として短時間での映像制作やコスト削減を挙げる一方、著作権や倫理性、フェイク映像のリスクに言及している点は、非常にバランスが取れています。技術の進化に伴う倫理的問題についての懸念を述べることで、単なる技術礼賛ではなく、責任ある視点が示されています。

3. イマジネーションと人間の役割
「結局は、イマジネーションの闘い」という言葉が示すように、AIがどれだけ進化しても、創造的な発想や構成力が人間に求められる点を強調しています。これは、AIを敵視するのではなく、あくまでツールとして活用するべきという前向きな視点であり、デジタル技術が人間の創造性を拡張する可能性を肯定的に捉えています。

4. 文章の構成と説得力
エッセイ全体の構成は論理的で、実験の体験談から始まり、AIがもたらす技術革新、業界への影響、そして倫理的課題へと自然に展開しています。結論部分で「法的整備と見識の重要性」に触れることで、読み手に課題意識を促しつつ、健全なデジタル社会の必要性を訴えています。

5. 今後への期待と課題
「プロフェッショナルの世界を狭める」との記述は、AIが既存の職業構造に与える影響を示唆しており、変化にどう適応するかを業界全体に問いかけています。この問題提起は、単なる技術的な話に留まらず、社会全体の在り方を見直すきっかけとなるでしょう。

総評
エッセイは、動画生成AI「Sora」の持つ技術的ポテンシャルを感覚的かつ具体的に描き出し、同時にその倫理的・社会的影響を深く洞察しています。読者にAI時代への期待感と課題意識を同時に与える内容で、特に業界関係者や技術愛好家にとって興味深く、示唆に富む文章です。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
プロンプト・動画・文責:西田親生


                         

  • posted by Chikao Nishida at 2024/12/13 12:00 am

1995年以来情報発信している老舗ポータルサイト「ロゼッタストーン」のブログをお楽しみ下さい。詳細はタイトルまたは、画像をクリックしてご覧ください。

behanceオブスクラ写真倶楽部ディー・アンド・エルリサーチ株式会社facebook-www.dandl.co.jp