Geminiの日本語版が、いつから使えるようになるのか期待している理由

Googleから2023年12月6日に、最新の高性能AIモデルとなる「Gemini」が発表されました。

特徴として、テキストだけでなく画像、動画、音声などの組み合わせをマルチモーダル処理が優れていることです。

下記の動画でのデモを見ると、Geminiがどんな処理ができるようになるかがわかります。

マルチモーダル処理の性能が高くなると動画や写真を見せながら質問をすると、それに合わせてテキストや写真を使って自然なレスポンスを戻してくるので、まるで人間とやり取りをしているような対話が、Geminiでは実現できるようになるようです。Geminiの日本語版が、いつから使えるようになるのかとても気になります。


Hands-on with Gemini: Interacting with multimodal AI (Gemini の実践: マルチモーダル AI との対話)

この動画ですが、実際にGeminがリアルタイムでデモストレーションをしているように見えますが、実際には編集された動画であるようです。

この動画は、リアルタイムの処理を撮影されたものではなく、Geminiに映像の静止画を提示してプロンプトを入力し、映像に字幕でプロンプトを表示したことなどが開発者ブログで明らかになっています。あくまでもこの動画は、Geminiで生み出すことができるマルチモーダルの処理がどのような体験を生み出すものになるかを表現したもので、開発者にインスピレーションを与えるために作られた動画のようです。

Geminiの3つのモデルの違い

Geminiは、性能の高い順に、Ultra、Pro、Nanoという3つのモデルが用意されています。

Ultraは最も性能が高いモデルで、最先端の処理ができるように設定され複雑なタスクに対応可能なモデル。

ProはAIチャットボットBardの最新バージョンでの利用で使えるバランスがよいモデルで、幅広いタスクに対処できるモデル。

Nanoは、スマートフォンで実行するために設計された小型モデルで、一番効率的なモデル。

Google Bardで、Geminiを使うことができるようなので、ChatGPTだけではなく、Google Bardも使うようにしてゆきたいものです。しかしながら残念なことに、現時点(2023年12月10日1時点)では日本語には対応していないようです。

Google Bard日本語版で、「あなたは、Geminiですか?」と確認をすると「いいえ、私はGeminiではありません。私は、Google AI によって開発された大規模な言語モデルですが、Gemini ではありません。Gemini は、テキストの生成、言語の翻訳、さまざまな種類のクリエイティブ コンテンツの作成など、さまざまなタスクに使用できる一方で、私は、テキストの生成、言語の翻訳、さまざまな種類のクリエイティブ コンテンツの作成に加えて、質問に対する回答、問題の解決など、さまざまなタスクに使用できます。

」と回答するので、まだ反映されていないようです。

現在、Geminiは英語版のみで提供されており、日本語版のリリースは、今後の予定のようです。

人工知能がマルチモーダルになった時に生まれる可能性

人工知能がマルチモーダルになった時に生まれる可能性は、より複雑なタスクの処理が可能になることです。

マルチモーダルで処理を行うと、テキスト、音声、画像など、異なる種類の情報を組み合わせて処理することができるため、単一の情報では処理が難しい部分も処理できるようになります。

例えば、対話する相手とのやり取りを分析する際に、マルチモーダルAIであれば、テキストや音声に加えて、表情やジェスチャーなどの情報も同時に処理をして分析することができようになります。情報量が増えれば、より正確に相手のニーズを深く理解することができるようになります。

上記を実現するために大事なのが、レスポンス速度(反応速度)です。人工知能の技術を活用することが一般化し始めた背景には、レスポンス速度が飛躍的に上がったことがあります。

そうした側面で注目されるのが、GoogleはGeminiを、トレーニング段階からマルチモーダルだと表現している点です。

Geminiは、学習段階から、テキストだけでなく、画像や動画で学習を進めているようです。

最近注目されている生成AIは、大規模言語モデル(テキスト)でトレーニングをされているので、Geminiはマルチモーダルの処置能力には大きな違いが出てくる部分があります。

日本の市場がAI市場として注目されてる理由

日本の市場は、人口が多いことに加え、経済規模が大きいことから、IT化が進んでおり、豊富なデータが蓄積されています。このデータは、AIの学習に欠かせないデータになります。

また、日本では個人情報保護法をはじめとする個人情報保護に関する法令関連も整備され、個人情報の収集、利用、提供などについて規制が設けられているため注目されています。