人工知能の質を向上するためのプロンプトエンジニアリング(Prompt Engineering)が注目されている。

DALL-E2やMidjourneyなどの画像生成AIが話題になることことが増えてきていますが、こうした画像生成AIを使いこなしてイメージ通りの画像を作り上げるには、特殊なスキルが必要になります。なぜなら、AIに欲しいイメージを伝える言葉を工夫することで、その仕上がりの質は、大きく変わってしまうからです。こうしたAIに欲しいイメージを伝えるスキルは、プロンプトエンジニアリング(çngineering)と呼ばれており、人工知能による思考プロセスを人間がサポートする技術として注目されています。現時点でのAIのパフォーマンスを最大化するためには、欠かせない技術であり、基本的に英語を使って書くことで精度が向上します。

プロンプトエンジニアリングでは人工知能と英語で対話する

人工知能から必要な情報を取り出すためのプロンプトエンジニアリングは、非常に重宝されるスキルですが、日本では英語力が弱い人が多いため、英語でプロンプトを使いこなすことが求められています。画像生成において、プロンプトエンジニアリングが注目されている理由が、デザイナーが自らのイメージ作りをスピーディに行うために、積極的にAIを活用しようとする取り組みがあるからです。デザインのイメージを固める際に、トーンの違いやタッチの違いなどを複数パターン制作するのには、作業時間がかかります。選ばれないバージョンの制作にも時間がかかるので非効率になります。サンプルになるイメージをAIで活用することで、参考になるイメージを一瞬で制作することができるので、時間効率を上げることができるのです。プロンプトエンジニアリングは、今後、AIのパフォーマンスが向上するまでの期間には重要なスキルで、高いスキルを身につけることで、AIをより有効に機能させることができるようになります。

AI画像の著作権は、誰のものか?

デザインの業界では、パクリ疑惑など、著作権はよく問題になることがあります。AI画像の著作権の考え方として、著作権法の保護対象は、作品そのものであると考えられており、画風などは、著作権の対象にならないと考えられています。また、あくまでも似ている場合には著作権違反と考えるのは難しいこともあります。また現時点では、ネットの大量画像の学習によって作風などを学習するAI学習も、著作物の利用は著作権違反にならないと考えられています。その理由は、人間が創作に関与せずAIの利用により自動的に作成されたコンテンツには著作権が発生しない扱いと考えられているからです。しかしながら、この問題は根深く、今後何かしらの問題が発生する可能性もあります。実際には、法整備が追いついていない部分があるため、商業利用に関しては制約がかかる可能性もあり、AI画像の著作権問題は、完全に明確になるには時間がかかるかも知れません。

キーワードに合わせて画像を自動生成してくれるMidjourneyの使い方

Midjourney(ミッドジャーニー)は、キーワードに合わせて画像を自動生成してくれるサービスです。その特徴は、美しいハイクオリティな画像が手軽に手に入ることです。今回のタイトルに入れている画像もMidjourneyで制作しています。無料で25枚作ることができるので、そのパフォーマンスを体感することができるます。なお、Midjourneyを商業利用する場合には、有料プランを利用する必要がありますので、ご注意ください。

簡単にMidjourneyの操作手順を説明します。

まず初めに、Midjourneyのトップ画面にアクセスし、「Join the beta」を押します。
必要な要素を入力して申し込みをします。
メールに案内が来るので、承認をしてください。これで登録は完了です。
次に、左側のNEWCOMER ROOMSにあるにあるnewbiesのどれかをクリックします。
あとは、コマンド(prompt)を入力することで画像が自動的に生成されます。
スレッドに入ったら「/imagine 」 と入力し、リターンを押します。
imagine prompt と表示されるので、prompt の後ろに英語でキーワードを入れてリターンを押してください。複数キーワードを入れるときは、カンマで区切って入れます。
これで候補の画像が表示されると思いますので、さらに作業を進めてゆきます。
絵の下に表示されているボタンをクリックすることで画像を補正してゆきます。
それぞれの意味は、U1からU4は、指定した画像の高解像度の画像が再発行されます。
また、V1からV4は、指定した画像と似たデザインが再度作成されます。

Midjourneyで活用できる英語のキーワード

Midjourneyを使いこなすためには、入力する英語のキーワードを使いこなすことが求めれられます。下記のキーワードを入力することで、イメージ通りの画像が生成できることを体感してみてください。また、他の人が試しているキーワードも確認できるので、そうしたキーワードを見てみるもの参考になると思います。AIにより精度良く理解できるためは、単語をカンマ区切りで並べるよりも文章の形にしたほうが、精度の高い画像が生成されるようです。良い感じの画像を見つけたら、どんな文章を入力しているかを確認して、文章のイメージを掴んでみてください。

画風を指定するキーワード

in Studio Ghibli style(ジブリ風)|by Vincent van Gogh(ゴッホ風)

画像を綺麗にするキーワード

Photorealistic(写実的)|8k(8k画質)

トーンなどを指定するキーワード

pop art(ポップアート)|futuristic(近未来)

タッチなどをしてするキーワード

oil painting(油絵)|photograph(写真)

こうしたキーワードを上手く組み合わせて、イメージ通りの画像を素早く生成できることがプロンプトエンジニアリングになります。Midjourneyに、適切な文章を入力することで、AIが高画質のイメージ通りの画像を生成してくれることを体感してみると人工知能を活用するイメージがリアルに想像できるのではないでしょうか?