ただし、完璧ではない点も見られた。例えば、専門的な話題(技術的な話など)に踏み込むと、やや曖昧な応答に終始し、深掘りできないこともある。これは音声部分の能力は高いが、AIとしての応答能力はまだ未熟であることを示している。Sesameの音声AIがOpenAIのLLM並みの能力を持てば、まさに「完璧」だろう。
こうした「ほぼ人間」の音声AIは、どのような形で事業化され、どのような価値を生み出すのか。少し考えただけでも、以下のようなものが思い浮かぶだろう。
1. カスタマーサポート
真っ先に思い浮かぶのはこれだ。感情を読み取るAIは、クレーム対応で共感を示しつつ解決策を提示できる。顧客満足度を上げつつ人件費を削減することが可能だ。コールセンター市場は約4000億ドル(グローバル市場)ともいわれており、まずはこの分野への参入が考えられる。
2. 教育・語学学習
語学学習のパートナーとしても有望だ。双方向会話でリアルな練習ができ、各ユーザーの性格や個性に応じた個別の対応もできる。オンライン教育市場(2030年で5000億ドル超予測)での展開も十分可能だろう。
3. カウンセリング
こうしたリアルな会話が可能なAIは「デジタルコンパニオン」として、現代人の孤独感を軽減するカウンセラー的な役割も果たせるだろう。また自殺予防や高齢者の話し相手などを行うホットラインでの活用など、AIが人の精神的な支えとなる可能性も見えてくる。
もちろん、課題もある。感情解析には詳細なデータが必要で、プライバシーや個人情報の悪用リスクが懸念される。また、これだけリアルな会話ができるようになると、それを悪用する者も出てくるだろう。更に、日本語を含む多言語対応の遅れは、グローバル化の障壁となる。実用までには、まだまだ解決すべき問題は多い。
しかし、Sesameの音声AIは、その自然さで「未来」を感じさせる。日本語対応は未実装だが、英語圏での成功を基に拡大すれば、日本での利用も期待できるだろう。カスタマーサポートから教育分野まで、音声AIの事業化の可能性は広い。倫理的課題をクリアできれば、人間とAIとの関係を変える可能性を持っている。
(文=掌田 津耶乃/テクニカルライター)