音声入力を活用したアプリ開発の新時代：Foundation ModelsとSpeech Frameworkの活用法

iOSDC Japan 2025

レギュラートーク（20分）

音声入力を活用したアプリ開発の新時代：Foundation ModelsとSpeech Frameworkの活用法

佐藤たけし hatakenokakashi

音声でアプリの入力が完結したらとても便利だと思いませんか？

音声入力の代表格である Siri は2011年に iPhone に登場して以来年々進化を遂げ、「声で操作する」という動作は当たり前のものになりました。
音声入力をアプリに組み込む方法としては Speech framework があり、日本語もサポートされており、音声をそのままテキストに変換ができます。
しかしアプリの入力は、テキストだけではありません。
トグルやピッカーなど、テキスト以外のアプリ入力としては Speech framework 柔軟性に欠けていました。

ところが、WWDC25 で発表されたオンデバイスLLM Foundation Modelsを使うと状況が一変します。
@Generableマクロを使うことでプロンプトから任意のSwift型のデータを出力できるようになったのです。
つまり Speech frameworkで音声入力をしてテキストに変換し、Foundation Modelsのプロンプトとして渡せば、アプリの入力を音声で完結できるようになりました。

このトークではSpeech frameworkとFoundation Modelsでアプリの入力を簡便にする方法を発表します。
Todoアプリを例に実装例やオンデバイスLLMでの効果的な利用方法をお話します。

「目次」
・Foundation Modelsとは？対応機種や制限は？
・Speech frameworkと組み合わせる実装例
・効率の良いプロンプト作成方法
・実際のユーザーの評価とフィードバック

あなたのアプリもキーボード中心の UX を“声だけの入力”へアップグレードしてみませんか？

fortee © 2025
forteeに関するお問い合わせ: @tomzoh

音声入力を活用したアプリ開発の新時代：Foundation ModelsとSpeech Frameworkの活用法 by 佐藤たけし

iOSDC Japan 2025

音声入力を活用したアプリ開発の新時代：Foundation ModelsとSpeech Frameworkの活用法

ログインが必要です