ロゼッタストーンBLOGニュース

The Rosetta Stone Blog

タグ » AI活用術

素人さんでも簡単生成AI活用術

20240212AI


 Midjourneyという画像生成AIを使うとなると、先ず、英語のプロンプト(prompt)というハードルが待ち構えている。

 大して難しいものではないが、AIが必要とする情報を順序立てて、補足説明を加えれば、思ったような画像を生成できるようになる。

 以下は、画像生成AI Midjourneyの基本のプロンプトであるが、[ ]の中をみると、サブジェクト、背景、時間帯、光のタイプ、レンズのタイプ、レンズ名、そしてアスペクト比など、ごく僅かな情報が書かれているに過ぎない。

 それでも、サブジェクト=ウサギ、背景=森林、時間帯=正午ころ、光のタイプ=太陽光や逆光、レンズのタイプ=35mm f1.4、レンズ名=Sigma、アスペクト比=16:9と、英単語にしたものを入れて、Midjourneyの「/imagine」の後に、このプロンプト全体をコピペしてクリックすると、1分程度でそれなりの画像が生成されるのである。

 また、ここで秘策を伝授することに。それは、英語が苦手な人への面白活用術だが、ChatGPT3.5(無料版)に(2)を入れて、「英訳せよ」と書けば、(3)のように英訳してくれる。

 ここで、Midjourneyのプロンプトが準備ができたので、Midjourneyのアプリを立ち上げ、使用可能な箇所で「/imagine」と記述して、その後に、(3)のプロンプトを流し込んで生成の指示を与えるだけで、後は待つことに。

(1)基本のシンプルなプロンプト
Midjourney prompt formula:
A photo of a [subject] with [background], during [time of day] with [type of lighting] and shot with a [type of lens] using [name of lens] --ar 16:9

(2)日本語を入れたプロンプト
Midjourney prompt formula:
A photo of a [ウサギ] with [森林], during [正午ごろ] with [逆光] and shot with a [35mm f1.4] using [Sigma] --ar 16:9

(3)ChatGPTで(2)を英訳させたもの
Midjourney prompt formula:
A photo of a [rabbit] with [forest], during [around noon] with [backlight], and shot with a [35mm f1.4] using [Sigma] --ar 16:9

▼ Midjourneyの画像生成用画面
20240212kiji-2


上の画面中央下の(+)で「/imagine」を書き、その後に、「A photo of a [rabbit] with [forest], during [around noon] with [backlight], and shot with a [35mm f1.4] using [Sigma] --ar 16:9」をコピペで準備完了。
20240212kiji-3


 生成中の画面が二つ。一つは、中央の公開されているもの、右上は自分のみプレビューできるもの)
20240212kiji-4


 だんだんと画像が鮮明になって行き、100%まで待つ。
20240212kiji-5


 上は、出来上がった画面。時間的には1〜2分程度であり、アスペクト比16:9の画像を4パターン生成されている。
20240212kiji-6


 上をクリックすると、「ブラウザで開く」と画面左下にあるので、それをクリックして、自分のパソコンにダウンロードすれば完了となる。
20240212kiji-7


 上は、4パターンの画像をブラウザで見ているところ。拡大も可能。
20240212kiji-8


 ブラウザで閲覧している画像を、自分のパソコンにダウンロードする直前の映像。
 4パターンが全て気に入れば良いが、一つだけであれば、このようにワンカットだけを選べば問題ない。既にお分かりかと思うが、光のタイプに「逆光」と入れたのは、ウサギの耳を透かして表現するために設定したのである。

▼MidjourneyとChatGPT4の相性の良さ

 上述は、MidjourneyのプロンプトをChatGPTに翻訳させて、それをコピペして、再び、Midjourneyで画像生成をした訳だが、ここで、二つの生成AIの相性の良さを利用して、Midjourney向けに作ったプロンプトをChatGPT4に直接提供したら、画像生成するか否かの実験を行うことに。

 結果は画像下の通りとなった。それなりにウサギが森の中に佇み、逆光を浴びて、静かに耳を立てている画像が生成されてきたのである。
20240212kiji-9


 以上のように、画像生成AIを活用するのは、全く難しくないことがご理解いただけたと確信する次第。

 何事も経験を積むことで、いくらでもスキルアップができるので、プロンプトに関しては、例えば、「少女が主人公。小高い丘の上に立つ少女の髪が長く風に吹かれている様子。少女の服装は白い細いベルト付きの水色のワンピースとスニーカー。可愛い小さな雲が浮かび、小鳥が囀り飛び回っている。丘の上には一本の木があり、少女と話をしたいと思っている。アスペクト比を16:9で、画風はパステルトーンの水彩画風で生成してください。」と適当な日本語で書いてみる。

 さて、ChatGPTがどのような画像を生成するのか、出来上がりは???なんとなくイメージに近い構図ではあるが、木が遠すぎて、遠近法でおかしくなっているが、ここで贅沢は言えない。
20240212kiji-10


 次に、先ほど何気に書き綴った日本語を、ChatGPTで英訳することに。

The protagonist is a young girl standing on a slightly elevated hill, her long hair being blown by the wind. She is dressed in a light blue dress with a thin white belt and sneakers. Cute little clouds float in the sky, and small birds chirp and flutter around. There is a single tree on the hill that seems to want to talk to the girl. Please generate the image in a 16:9 aspect ratio, in a pastel-tone watercolor style.

 これをコピーして、今度は逆に、Midjourney側へ持ち込み、画像生成できるかの実験をしてみたい。出来上がった画像は以下の通り。

 アスペクト比は16:9にはなっていないが、丘にいる少女の長い髪が風になびき、真っ白な雲と小鳥がたくさん飛んでいる画像となっている。スニーカーは履いているものと履いていないものがあり、白い細いベルトはないようだ。
20240212kiji-11


 このように、生成AI同士が相性が良ければ、プロンプトをガッチリ固めて挑まぬとも、素人さんでも自由な発想で活用できることがご理解いただけたかと・・・。これに、プロンプトに詳細を付加して行くだけで、どんどんと画像の構図や質感が向上し、リアルな写真も生成可能となる訳だ。

 何はともあれ、少しでもご興味ある方は、生成AIにチャレンジされては如何だろうかと・・・。
----------
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
 https://www.dandl.co.jp/Link
AIプロンプト・文責:西田親生


             

  • posted by Chikao Nishida at 2024/2/12 12:00 am

あなたの我流Macでは、勿体無い。

welldone-square-3


<我流でMacを使う人>
 MacBook Pro、MacBook Air、iMac(Apple Inc.)のMacユーザーで、これぞ目を見張るような使い方をしている人は実に少ない。また、長年使っている人でも、我流にてMacパワーの10分の1も出せない人がいる。

<Macに付属する代表的なアプリ>
 Macを購入すれば、ワープロ(Pages)、表計算(Numbers)、プレゼンテーションツール(Keynote)など、その他の基本アプリは全て無料である。勿論、PagesはWordへ、NumbersはExcelへ、そしてKeynoteはPowerpointに対応している。また、OSがバージョンアップすると、自動的にアプリもバージョンアップする。

 一般的なMacユーザーは、PagesとNumbersを多く使っているが、実は、Macという生き物は、数十年変わらぬ事務処理だけでは飽き足らず、付属しているアプリを全開することで、とんでもない武器(weapon)になってしまう。

<複数デスクトップとマルチタスク>
 複数デスクトップをさらりと使えば、マルチタスクが可能になる。一つの机でワープロを用い文章を書き、隣の机で画像処理を行い、また隣の机ではブラウザでネット検索をしながら調べ物ができる。

 筆者の場合は、保有するアプリケーションの総数は80前後。デスクトップは、仕事中には常に5つ以上の机を準備している。

 複雑な調べ物をしながら頭の整理をするには、MindNode(有料アプリ)を使い、画像処理においてはiCloudを保管先としながら、「Pixelmator Pro」や「Affinity Pro」などのエディタを補完的に利用する。

<iCloudと写真・動画>
 iCloudの写真・動画保管と加工の両刀使いができるアプリは「写真(Photo)」であり、リサイズやエフェクトなどは、誰でも目を瞑っていてもできる。更に、動画をアップすると、「写真(Photo)」で水平微調整や色相、トリミングなどが楽々加工可能となっている。

<iCloudの安心安全保管>
 iCloudは無料でも5GBのストレージが使用可能(次のストレージ容量料金を参照)である。自動的にクラウドでデータが安心安全に保管される。金銭では買えない貴重なデータなので、安心安全保管は非常にありがたい。万が一、Macが水没したり壊れたり紛失しても、データは完全にバックアップされており、全く慌てる必要はない。

<ストレージ容量料金>
 5GB 無料/50GB 月額130円/200GB 月額400円/2TB 月額1,300円

<Macの原点はタイポグラフィ>
 元々、Apple Macintosh(現在のMacの祖先)開発当時の原点は「タイポグラフィ」にある。よって、多種多様なフォントが無数に開発され、特に上述のアプリは全て自社開発のものであり、AppleOSに最適に働くように作られている。

▼タイポグラフィとは、文字を読みやすいデザインにするためのルール。
https://ja.wikipedia.org/wiki/Link タイポグラフィ

<フォントの重要性>
 昔のWindowsが画面では文字表示がガタガタだった時代に、既にMacはTrueType Fontを採用しており、PostScript Fontが導入されるまでは、最高品質のフォントを誇っていた。それほど、Macはアーティスティックに開発されており、「究極の美」を追求した逸品として現在に至っているのである。

<一つ、二つ上を行くプレゼン>
 MacのプレゼンアプリはKeynoteだが、それこそ簡単にお洒落でインパクトのあるプレゼンが可能となる。テキストや写真は勿論のこと、音声や音楽、その他動画も同じKeynote上で連携でき、視聴者の五感を魅了するような強烈なコンテンツ制作が可能となる。

<Macと連動するデバイス>
 MacBookを使用している人が、さらにiPhoneやApple Watch、iPadなどを連動して利用すると、より効率の良い業務処理が可能となる。

 最近は、自動車業界もiPhoneとの連動を優先した新車開発を進めており、iPhone機能を持ったMacの魂が入ったアバターのような車に様変わりしている。

<Macというモンスター>
 筆者がApple社製のMacintoshを入手したのは1984年であった。40年近く前に、Macはタイポグラフィの概念、デスクトップの概念、ビットマップディスプレイによるTrueType Fontを取り入れており、Macは常に10年先を見据えたモンスターであった訳である。

<最後に・・・>
 標題に戻るが、要は、Macを普通の一般的なパソコンとして使うことは、非常に勿体無いということだ。Macには秘められた思想や哲学があり、それらを理解せずして我流で使ってしまうと、他の安価なパソコンと同じ程度の活用しかできない。

 筆者が研修中にZOOMでMacの優れた連動機能を実演すると、画面の向こうからは、驚きの声や溜息が聞こえ、「やっぱり、Macが欲しいな!」と、皆が口を揃えて言っていた。

mac20230619-4


<記事サンプル>
▼あなたの我流Macでは、勿体無い。
WellDonearticlesample-1


WellDonearticlesample-2


▼AIは、確かに凄い。
WellDonearticlesample-3


WellDonearticlesample-4


◎西田親生のZOOMセミナー「Well Done」
https://note.com/chikaonishida/m/m3b84ef9b3551Link
----------
◎西田親生のICT&AIセミナー
https://note.com/chikaonishida/m/m3b84ef9b3551Link
◎ロゼッタストーン公式サイト(since 1995/熊本県第一号WEBサイト)
https://www.dandl.co.jp/Link
画像生成AI プロンプト/文責:西田親生


                 

  • posted by Chikao Nishida at 2023/6/20 12:00 am

1995年以来情報発信している老舗ポータルサイト「ロゼッタストーン」のブログをお楽しみ下さい。詳細はタイトルまたは、画像をクリックしてご覧ください。

behanceオブスクラ写真倶楽部ディー・アンド・エルリサーチ株式会社facebook-www.dandl.co.jp