ジェネレーティブAIを使いこなすために考えておくべきこと

今回は、画像生成AIのmidjourneyや文章生成AIのChatGPTなどが生み出すクリエイティブの質の高さから話題になる機会が増え始めているジェネレーティブAI(自ら生成できる人工知能)について解説してゆきたいと思います。

今後は、進化し続けてゆく人工知能を上手く使いこなすことが、あらゆる分野で重要なスキルになってくるのではないでしょうか。

ジェネレーティブAIを使いこなすためには、プロンプト(指示文章)の使い方やその仕組みを理解しておくことが大切です。

現在のジェネレーティブAIの基本的な構造は、インターネット上に存在する莫大なデータを学習データとして活用することで、深層学習や強化学習などの技術を駆使して、人間が作り出すような画像などを生成することが可能となっており、そのアウトプットを磨き上げています。

ジェネレーティブAIは、その仕組み上、大量のデータを学習することが不可欠です。インターネット上にある膨大な量のデータをAIが学習することで、自然なアウトプットを生み出すことができるのです。

そのため、ジェネレーティブAIを使いこなすためには、人工知能に何をしてもらうのか、的確な指示を出すこと大切です。プロンプトの質を上げることで、質の高いアウトプットを手にすることができます。

プロンプトを作る際、大切なのが、プロンプトの(日本語、英語)文章構造をわかりやすくすることです。意識しておきたいのは、いつ、だれが、どこで、何を、どのように、するのかを明確に指示することです。

midjourneyの使い方

midjourneyは、ユーザーが打ち込んだテキストから画像を生成するジェネレーティブAIなので、少し掘り下げて使い方を説明いたします。

midjourneyでは、冒頭に、/imagine prompt と記述をして、画像づくりを行います。

下記のように記述します。

/imagine prompt

A young woman with orange hair.

She enjoys playing guitar in a field.

It was taken by a professional photographer with a single-lens reflex camera.

(オレンジ色の髪をした若い女性。野原でギターを楽しんでいる。プロのカメラマンが一眼レフカメラで撮影したもの。)

さらに生成された画像に表現を加える場合には、次のような文面を追加します。

Japanesse anime style.(日本のアニメ風)

France in the 18th century.(18世紀のフランス)

ar 16:9 (比率を16:9のサイズ)

こうしたプロンプトを入れて条件を絞り込んでゆきます。

プロンプトは英語で記述した方が表現を細かく解釈してくれるので、DeepLなどの翻訳ツールを活用することをおすすめします。

ChatGPTでmidjourneyのプロンプトを作る方法

1)欲しい画像イメージの説明を文章にします。

例)

夕暮れの海の近くに止まっているかっこいい車をデザインしてください。

ここで長めの説明文が生成させれると思います。

2)上記を300文字以内でまとめてください。

1で生成された説明文を300文字程度の短い文章にまとめます。

3)上記を英語で画像生成用のプロンプトにまとめてください。

2の説明文を、英語でプロンプトにまとめます。

3で生成された英語文を、midjourneyのプロンプトに打ち込み、画像を生成します。

ジェネレーティブAIの問題点と人間の価値

現在のジェネレーティブAIにはまだ課題も数多く存在しています。例えば、偽情報や差別的な発言など、社会的に望ましくないアウトプットが生成されることがあるため、クリエイティブに問題が無いことを判断することは、人間にしかできません。AIは人間のように感情や道徳的判断を持っていないため、社会的なルールや倫理観を無視することがあるためです。

また、AIが人間を超えて学習しすぎた場合、AIが独自の思考を持ってしまう恐れもあります。そのため、AIの学習の適切な制御が必要だと考えられています。

こうした課題があるとしても、ジェネレーティブAIの応用範囲は、どんどん広がってゆくはずです。AIの進化が進むにつれて、私たちの生活において、人工知能が欠かせない存在になっていくことは間違いありません。ジェネレーティブAIは、人間の能力を拡張する可能性も持っているからです。

ジェネレーティブAIの性能が飛躍的に向上した場合に、人間が介在することで、AIが社会的なルールや倫理観を守ることが求められます。