Voice Watchの最新機能を中心に、志村さんにうかがいました。
今回考案したアイデアの紹介をお願いします!
実況音声をリアルタイムで生成するAI「Voice Watch」を開発しました。
志村さん 私たちが目指すのは、視覚障がいのある方と健常者の情報格差をなくし、すべての人がスポーツ観戦を楽しめる社会の実現です。そのために、スマートフォンのカメラ映像と走行データの分析から、視覚に障がいがある方のための実況音声をリアルタイムに生成するAI、「Voice Watch」の開発、アップデートを行っています。
仕組みは、まず目の代わりになるカメラがレースの様子を映し出し、その大量のデータをもとにAIが分析を行い、これから何が起きるかを予測し、AIによるフレーズの発話でレース実況を届けます。今何が起きているのか、これから何が起きるのか、それをどう伝えるか、という3つの絵が重なることで、現地でリアルタイムの実況が生成できるようになっています。
視聴方法には試行錯誤がありましたが、今はヘッドホンを装着すると自動的に実況の音声が流れる仕組みです。
発案のきっかけは何ですか?
障がいのある方と健常者の間の、情報格差をなくしたいと考えています。
志村さん グループ企業で視覚に障がいがある方がいて、モータースポーツをどうすれば楽しめるか、話を聞いたことがあります。
会場への行き帰り、会場内での移動にハードルの高さを感じているのかと思っていましたが、「そもそも会場に行きたいと思ったことがありません」という答えが返ってきました。理由は「モータースポーツに限らず、視覚に障がいがあると現場でスポーツを楽しめないから」ということでした。
理由をもう少し深掘りすると、移動が大変というのはもちろんですが、現場で何が起こっているのかを「一緒に行く家族、友人に確認するのは申し訳ないし、相手も嫌だと思っているでしょう」と聞きました。障がいのある方と健常者の情報格差は、私たちが想像する以上に大きいと気づき、障がいのある方のスポーツ体験を変えたいと思ったところから、このプロジェクトはスタートしました。
利用された方からはどのような声が寄せられていますか?
「ひいきのチームを中心に応援したい」というヒントをいただきました。
志村さん 前回の実証実験では、レースの全体像を伝えることがミッションで、体験された方からは「わかりやすい」「面白かったです」など、好意的な評価をいただきました。成功と言えると思いますが、その一方、「特定のチームやドライバーを応援したらもっと楽しめるかもしれません」という声を複数の方からいただきました。
確かに、野球でもサッカーでも、ひいきのチームや選手がいると、応援にはより熱が入るし、のめり込めると思います。視覚に障がいがあると難しいのですが、AIを使って、応援したい特定のチームにフォーカスした実況を提案できないだろうか。
そこから生まれたのが、今回実証する「推し実況」です。一人ひとりにパーソナライズされた情報提供で、スポーツ観戦をより楽しんでもらいたいと考えています
実証に向けて苦労していることは何ですか?
スムーズに感情移入できるよう、言葉のチョイスにも気を使います。
志村さん 全体実況は、今、コース上で起こっていることを正確に把握する必要がありますが、推し実況となると、全体の把握に加えて、チームやドライバーに絞り込んだ情報の把握と提供が必要になります。その情報がリアルなほど、聞いている人は感情移入できるはずですが、フレーズ一つひとつのチョイス、チューニングが難しいところです。作り手側が何を伝えるべきかを理解し、設計しなければいけないところだと思います。
実は、7月に開催された世界水泳で推し実況を試してみました。会場には、いろんな国の人たちが自分の国の選手を応援するために集まっています。普通の実況だと先頭争いが中心になりますが、推し実況は順位に関係なく、その人が応援したい選手に絞って実況するため、とても大きな可能性があると感じました。
本コンテストに参加した理由を教えてください!
より進化させたシステムの有用性を確認するためです。
志村さん 2022年の活動を通じて、AI実況の可能性が確認できました。それは「データをもとにレース変化の兆しを伝える未来予測型の実況」、「いつでもどこでも24時間、疲れ知らずの正確な実況が可能」、「みんなに1つの実況ではなく、一人ひとりにパーソナライズされた実況」の3点です。
ここに「個別のチームごとの実況も聞いてみたい」というフィードバックも加え、より進化した、「推し実況」が可能なシステムを開発しました。その有用性を確認することが目的です。
本コンテストでの挑戦、実証内容はどういったものになりますか?
「推し実況」の魅力と可能性を、多くの人に体感していただきます。
志村さん バージョンアップした「Voice Watch Ver.2」を使い、前回よりも進化したAI実況を検証します。注目していただきたいのは「推し実況」です。ボタンを押すと、自分が応援したいチーム中心の実況を、AIが自動で生成して聞かせてくれる構成になっています。
世界水泳では、全盲のおばあちゃんに「Voice Watch Ver.2」を装着していただき、推し実況を体験してもらいました。推しはもちろん、日本の選手です。レースでは日本の選手が2位でターンして、その瞬間、会場がすごく盛り上がりました。同時に、目が見えないおばあちゃんも立ち上がって、興奮しながら日本の選手を応援していたんです。
そこには、障がいのある方と健常者の間の情報格差はなかったですし、おばあちゃんも会場と一体になってスポーツ観戦を楽しんでいました。水泳、そして今回はモータースポーツですが、いろんなスポーツで推し実況が実現したら、障がいがある方にとってスポーツ観戦は身近になるし、社会も面白くなるはずです。
今回の実証実験で多くの方に体験していただき、次のステップに進みたいですね。
最後に本コンテストにかける想いをお願いします!
パーソナルとワールドワイド、2つの方向性が見えています。
志村さん 今回の実証実験を成功させて、その先に目指す方向として、大きく2つを考えています。
1つはとてもパーソナルな方向で、子どもの運動会での実況です。視覚に障がいがある方が運動会に行っても、子どもの様子を詳しく知るのは難しいそうです。でも、AIが生成する推し実況があれば、自分の子どもにフォーカスした実況を聞くことができるので、運動会へ積極的に参加できるようになるはずです。
もう1つは少し大きな視点で、世界での展開も視野に入れています。スポーツの国際大会の場合、実況は有力選手が中心で、上位争いできない選手にフォーカスされることはありません。推し実況なら、自国の言葉で、自国の選手にフォーカスした実況が可能になるため、間違いなくよろこばれるはずです。
運動会のようなパーソナルなスペースでも、世界大会のような大きなフィールドでも活躍できるよう、Voice Watchを進化させていきたいと思います。