はじめに
前回紹介したGPT-4Vですが、ChatGPT上でDALLーE3が使えるようになり、従来通りの使用感で画像生成ができるようになりました。この画像のクオリティは、MidjourneyやStable diffusionと同じレベルの画像が出力できます。
しかも、DALLE3は商用利用も可能であることも大きなメリットです。
ChatGPTが神アプデ!『GPT‐4″V”』の驚異的な進化とは!? | AI✖業務効率化 ブログ (arun-works.com)
今回は、このGPT-4Vの画像生成機能がいかに革命的であるかということを紹介します。
GPT-4Vで画像生成機能を利用する方法
GPT-4Vの画像生成機能を使うためには、ChatGPT Plusに課金する必要があります。GPT-4Vは、GPT4ベースであるため、GPT4を使えるChatGPT Plusに入会していることは必要条件になります。
ChatGPT Plusに入会していれば、ホーム画面でGPT-4をクリックすると以下のような表示が出ると思うので、ここで「DALL-E3」を選んでください。
その後は、プロンプト入力個所に欲しい画像の指示を入力してもらえれば簡単に画像が出力されます。
今回は、非常にシンプルに「かわいい猫の画像を描いてください」と指示します。その結果がこちらです。
非常に短いプロンプトでここまでのクオリティの高い画像が出てくることに驚きです。
GPT-4Vは革命的にすごい
この画像生成、本当に簡単にできたように見えると思いますが、これって実は今までは出来なかったことなんです。
従来の画像生成AIでは、この欲しい画像を得るための指示文(プロンプト)の内容が全てでした。そのため、欲しい画像を出力するために、必要な情報やディテールを可能な限り言語化して詳細に書く必要がありました。
例えば、この画像一つとっても、正確に記述しようとすれば、以下のようなワードを入れないとAIが理解してイメージ通りの画像を出力は出来ません。
・a playful long-haired kitten
・in the gentle glow of sunlight filtering through a window
・a soft, fluffy coat, predominantly cream in color with hints of grey stripes
・a wide, enchanting and dark and shimmering eyes
・a fluffy tail should be arched high, emphasizing its playful mood.
・the ambiance should be warm and homely
・with wooden flooring and soft drapes in the background.
これらのワードを自分で考えなくても、この画像がシンプルなプロンプトで出力できてしまう、これが今までの画像生成AIではできなかったGPT-4Vのすごさです。まさに革命的です。
さらに生成した画像のプロンプトも見れる
これは、追加で作った「かわいい猫」の画像です。この猫の画像を選ぶと、右側にプロンプトが出力されます。このプロンプトをコピーする(「Copy」のボタンがあるのが親切ですね)ことで、同じような画像を出力することができます。そのイメージが以下です。
このようにすることで、自分のイメージするような画像を繰り返し出力することが可能です。
まとめ
GPT-4Vが可能にした画像生成の機能は、これまでの画像生成の苦労を吹っ飛ばすほどの衝撃です。言い過ぎではなく、誰でも高品質の画像が生成できてしまいます。
ChatGPT Plusへの入会(課金)は必要ですが、それ以上の価値があります。
私自身、欲しい画像を出力するためのプロンプトの作製がうまくできず、あまり生成型AIのすごさを感じることができませんでした。
しかし、この画像生成機能は本当にすごいです。
今の内に触っておいて、絶対に損のない機能です。
今後、更にAIは進化していくと思いますが、この流れに遅れないよう、今のAIの最前線にいるGPT-4V、ぜひ使ってみてください。
AIと共に未来を創る!
コメント