2020年、大晦日は今年もゆっくり紅白歌合戦を見つつ、飲んでました。
今回の紅白歌合戦にもいろいろな出演者がいましたが、その中でAI美空ひばりという企画がありました。
AI歌唱の可能性
美空ひばりさんはもうずいぶん前に亡くなられた歌手です。そんな美空ひばりさんが昨年末ニューシングルを発売し、紅白歌合戦に出演しました。
これは最新技術によって美空ひばりさんの歌を過去のライブラリから抽出し、AIによる音声合成で歌わせたものになっています。
具体的にどのような技術だったのか、秋に放送されたNHKの特番を見てないので細かいことはわかりませんが、おそらくボーカロイドのような素片連結合成のものではなく、最近なにかと使われる機会が増えている統計的パラメトリック音声合成なのかなと思います。
音声の特徴さえ分析してしまえば、どんな人の声にも変えられるということで、ボーカロイドのように素材を収録しなくても再現可能というところが面白い技術です。そのため、今回のようになくなった人の歌声を生成することができるのです。
テーマは倫理的な問題へ
このAI美空ひばり、見てましたけど個人的には不快感や気持ち悪さを感じることはありませんでした。
こういった人口合成のもので感じる気持ち悪さの理由は、不気味の谷である場合が多いです。不気味の谷というのは、明らかに作り物だろうというラインと、明らかに本物だろうというラインの合間のところで、その境目のところにあるものを人間は気持ち悪いと感じてしまう現象です。
自分の主観ですが、このAI美空ひばりに不気味の谷を感じることはありませんでした。とてもよくできています。
ですが、今回は別の観点から気持ち悪さを訴える声もあがりました。
これは倫理的な問題にも通ずるところがありますが、こうやってAIで再現すること自体が冒涜ではないのか、ということです。
これを指摘していた記事にもありましたが、例えばもし昭和天皇を最新技術によて再現し、なにかを喋らせたり動かしたりするようなことでもやれば、それはもう凄まじい批判が起きたことでしょう。
じゃあ昭和天皇はだめで美空ひばりさんはいいのか、というところで、このライン引きは受け手と作り手の感じ方次第です。
見分けはつかなくなるかもしれない
音声合成の技術も進んでいますし、同様に映像の技術も進んでいます。実際の動画の顔だけを差し替えるような技術や、写真を動かす技術もあります。
ディープラーニングによって分析されたデータとその加工技術は、これまで人間がやっていた作業よりもスピーディに、大量に処理を行うことができます。
もはや現時点で、見分けはつかなくなるかもしれません。
これはけっこう恐ろしい技術で、前にもブログで紹介しましたが、例えば安倍首相やトランプ大統領の音声データや画像データを元に、実際には言ってないようなことを言わせてしまうことは可能なわけです。そういった動画が世界中を駆け巡り、国際情勢や経済をコントロールすることもできてしまうかもしれません。
こういったテクノロジーは、技術面だけではなく倫理面の議論も徐々に必要になってくるわけですね。
今回のAI美空ひばりを見て、自分自身は何一つ不快感はありませんでしたが、よくよく考えるとけっこう難しい問題なのかなとも思います。それにみんながOKならOK、としてしまっていいのかというところも含めて、こういったところも次のテーマとなっていくんだろうなと思います。