西谷圭介
Keisuke69
生成AIの進化とともに、音声AIを活用した音声インターフェースが再び注目を集めています。しかし、実際にプロダクトへ組み込む立場から見ると、「どれを使うべきなのか」という問いに明確な答えはありませんでした。本セッションでは、失語症支援アプリ『Speech Link』を開発する過程で、音声AIの利用者として主要サービスを検証した結果を共有します。Speech Linkは、AIと専門家による失語症当事者の言語回復支援を目的に開発されているサービスで、今回の検証の背景となっています。 OpenAI、Gemini、ElevenLabs、Deepgram、Livetoon、そしてAmazon PollyとAmazon Transcribe。 これらを同一条件で評価し、精度や自然さ、レイテンシの観点から「使える/使えない」を選定しました。盛り上がる音声AIの現在地と、今選ぶべきAIを20分で提示します。