こんにちは、あんどう(@t_andou)です。
少し前ですが、こんなニュースが話題になっていました。
詳細は深追いしていませんが、ニュースキャスターの人物モデルをコンピューターで再現して音声も読み上げさせているようです。
また、政治やエロ方面で問題になっていましたが、deepfakesと言う「顔をすごくリアルに入れ替えることができる技術」も話題になっています。
japanese.engadget.com
去年は3Dモデルを使った『Vtuber』が流行りましたが、今後はこう言ったリアルなアバター?がいろんな方面で出てくるんでしょうね。
と言うことで、今回からその基礎になるようなものを作ってみたいと思います。*1
とは言え、ただリアルな見た目・リアルな声のYoutuberだとしたら、実写で良いのでは?と突っ込まれそうですので、 生身だと出来ないこと…具体的には『24時間生放送をする人工知能Youtuber』を最初の完成形として目指したいと思います。
完成形のイメージ
すごくザックリとこんなイメージです
・視聴者からコメントが来たらそれに対して返答をする
・表情や声は出来るだけ実際の人物っぽく
・BGMも人工知能で生成したものを使う
・24時間放送し続ける
将来的にはニュースとかお笑いなどの要素を取り入れていけたら面白いかもしれないですが、そこまで先のことは考えずにやってみます
どうやって作るのか
概要
— あんどう@競艇・競馬AI (@t_andou) 2019年1月14日
1. コメントを取得するものを作る
2.取得したコメントを対話APIに投げて返す
3.音声合成(棒読みちゃん)で読み上げる
4.最初は3Dモデルを表示
5.4を進化:fakedeepとかで顔を生成して実写っぽく
6.3を進化:声質変換で自分の声で読み上げ
7.2を進化:対話の内容を強化していく(やり方は未定)
こんな流れでイメージしていますが、壁にぶつかった場合はやり方を変えて行くこともあると思います。
その辺りは臨機応変に進めていきますので、ご了承ください。
次回
・YoutubeLiveで投稿されたコメントを取得
・コメントに対して反応をするものを組み込む
・画面上に表示するようにする
この辺りまで作っていきたいと思います
→書きました
チャンネル登録お願いします
このチャンネルで放送しますので、良ければチャンネル登録をよろしくお願いいたします。
*1:出来るかどうかは分からないですが、とりあえず挑戦していくスタンス