AIフレンドリーな開発・検証サイクル ― 音声生成の表現品質を高速に高め続けた仕組みの実践知 by shinofara

YAPC::Fukuoka 2025
トーク(20分)

AIフレンドリーな開発・検証サイクル ― 音声生成の表現品質を高速に高め続けた仕組みの実践知

shinofara shinofara shinofara

Cotomo というAIキャラクターと会話するサービスを開発しています。会話体験はいくつもの要素で成り立ちますが、その中でもユーザが強く感じるのが「声の表現品質」です。同じ「はい」でも言い方やテンションで印象は大きく変わり、これをどう検証し続けるかが課題でした。

最初はスプレッドシートに音声を貼り付けて管理していましたが、数が増えるほど評価やフィードバックが滞り、検証速度が落ちていきました。そこでサービスを支える検証やオペレーションの生産性を最大化するために、AI時代だからこそ自前で0からツールを作りました。このツールは単なる管理ではなく、利用者であるMLエンジニアやオペレータが自分でUIを変えたり試行錯誤できる仕組みを持ち、使いやすい形に育てていくことにも繋がりました。

本セッションでは、「AIを前提にした試行錯誤の仕組みづくり」について、現場で積み上げてきた工夫と学びを紹介します。
Vibe Codingだけではなく、Vive Codingでの生産性を高める為のアーキテクチャや仕組みなどをお話できればと思います