ShazamKitの魔法を解き明かす: 音楽認識技術「オーディオフィンガープリント」の探検! by Shogo Yoshida

iOSDC Japan 2023
採択
2023/09/02 17:05〜
Track B
ルーキーズLT(5分)

ShazamKitの魔法を解き明かす: 音楽認識技術「オーディオフィンガープリント」の探検!

shzero5 Shogo Yoshida shzero5

カフェのような喧騒の中でも、Shazamがどのようにして音楽を精度良く認識しているかご存知ですか?
このライトニングトークでは、WWDC2023でアップデートが発表されたShazamKitの核心となる技術、オーディオフィンガープリントに焦点を当て、その神秘を解き明かします。
わずか数秒のフレーズから全曲を特定し、騒々しい環境でも音楽を正確に認識する方法を、その驚くべき技術と共に掘り下げます。
5分間の発表で、楽曲を視覚化するスペクトログラムから始まり、音楽の「指紋」となる時間と周波数の2次元の星座図について説明し、そして、この「指紋」がどのようにデータベース内の楽曲とマッチングし、最終的に特定の曲を見つけ出すのかを明らかにします。
普段あまり触れることのない音楽認識技術の面白さを共有し、皆さんに新しい発見をしていただけることを期待しています。