音声知識ゼロ!音声データの解析・ベクトル化・学習をマイクロサービスとして開発して得たこと by 大重智志

PHPerKaigi 2020
15分トーク

音声知識ゼロ!音声データの解析・ベクトル化・学習をマイクロサービスとして開発して得たこと

_ohshige 大重智志 _ohshige
7

ユーザ投稿型の音声配信サービス内のひとつの機能として、あるユーザにとって好きな投稿をレコメンドすることになりました。
分析の結果、「好きな投稿=よく聴く投稿に似ているもの」であるだろうと仮定し、似ている投稿とは何なのかの研究が始まりました。
投稿データは音声の波形データであるので、その音声データを解析して特徴ベクトル化し、それを用いて似ている投稿を学習により推定することにしました。
そして最終的に、音声知識が皆無である中、音声データの解析手法やベクトル化手法とその実装について試行錯誤し、最終的にはサービスにそのまま組み込むのではなくGCP上でマイクロサービス化することで疎結合なシステムを作り上げました。

これは、Pythonを用いて、音声知識がゼロの状態から、数多の音声データを聴き様々な手法を試し学習させマイクロサービスを完成させた、PHPerによるトークとなります。

具体的には以下のような内容を予定しています。

  • 音とは何か
  • 「似ている」とは何なのか
  • どのような解析手法を使ったのか
  • どのように特徴ベクトル化しているのか
  • どのような学習をさせたのか
  • 最終的にどのようなレコメンドになったのか
  • 設計・マイクロサービスについて

基本的にPythonを使って実装しており、PHPの話は一切出来てきません!

想定している対象者

  • 音声解析に少し興味がある
  • 機械学習に少し興味がある
  • マイクロサービスに少し興味がある
  • Pythonが好き

話さないこと

  • 音声解析の本格的な理論
  • 機械学習の本格的な理論
  • PHP!