GAN(敵対的生成ネットワーク)とディープラーニング(深層学習)
GANとは
GANとは、Generative Adversarial Network(敵対的生成ネットワーク)と呼ばれる人工知能の仕組みです。GANはデータから特徴を学習することで、実在しないデータを生成したり、存在するデータの特徴に沿って変換できます。
GANのネットワーク構造は、Generator(生成ネットワーク)Discriminator(識別ネットワーク)の2つのニューラルネットワークから構成されており、互いに競い合わせることで実存しないデータを作り出す仕組みです。
本物に似せてデータを作り出すGeneratorと本物のデータと見比べて、本物かどうかを判断する鑑定Discriminatorを競争させるような形(敵対的)で、学習させます。偽物を作る役割と偽物を見破る仕組みを競わせて、教師なしで学習が可能になることです。従来の深層学習(ディープラーニング)では、学習のためのデータが必須でしたが、GANでは学習データの問題を補うことが可能になるのです。
GANが悪用されるリスクとは
GANは画期的な仕組みなのですが、悪用されるリスクが数多く存在しています。まず、技術の精度が上がってゆくことで一番問題になるのは、その技術の使い方です。
GANを使えば画像生成の品質や精度は劇的に向上しますが、同時に人間の目では判別がつかないような精度の高い偽物(フェイク)を生み出すことができる様になります。
私たちは、「いいことに使うつもりで作ったツールは悪いことにも使える」ことを強く意思しておく必要があるのです。本当に注意しなければならないリスクは、人工知能を悪用する人間の行動なのだと思います。人間の倫理が もっとも恐れる必要あるリスクなのです。
例えば、ディープフェイクは、実際に世論を操作するために公人の名声を傷つけたりすることに使われたりしていますし、ビデオ通話で(ほぼ完璧な形で)誰かになりすまして犯罪に悪用されてしまうこともあります。
GANが期待されるポイント
GANは悪用されるリスクが存在していますが、それ以上に期待されているポイントがあります。人間の倫理がもっとも恐れる必要あるリスクであるのですが、そのリスクを低減することができる可能性があります。
ディープラーニング(深層学習)は、自動化されることで、人間の意思が入った学習データや学習方針のないまま、AIに高度なレベルの知能を習得させることが可能になり、どのように学習したか、そのプロセスが全くわからなくなってしまっています。
その学習プロセスで、例えば、学習データに、データに微細なノイズを加え、機械学習の分類や予測を狂わせることができてしまう敵対的サンプル(Adversarial example)と呼ばれる問題があります。
画像データに、人間の目では認識できないようなわずかなノイズを加えて、意図しない判定が出るように操作することができてしまうのです。
人の目では判断できない画像をトリガーに、人工知能に誤動作を引き起こさせることができてしまうのです。
こういった敵対的サンプルを判別する技術として、偽物(フェイク)を見分けるGANのDiscriminator(識別ネットワーク)が活用できると考えられています。
学習データとして活用
GANがを活用すれば、自動的に画像を大量に生成することができます。
教師データとしての画像が足りない場面で、データ収集の手間と時間が取れないケースでも、GANで大量に生成した画像を学習データとして活用すれば、データが不足しがちプロジェクトでも、AIの学習を進めることができる可能性があります。
GANを活用することで、簡単に大量かつオリジナルの画像を作成できることは、ディープラーニング(深層学習)のための画像データの活用をより発展させる可能性があります。