プロポーザルに通したいのでプロポーザルのテキスト分析をします! by shunsock

PHPカンファレンス北海道2024
採択
2024/01/13 17:50〜
クリエイティブスタジオ
LT

プロポーザルに通したいのでプロポーザルのテキスト分析をします!

shunsock shunsock shunsock

概要
PHPを用いてサービスを提供しているPR TIMESの機械学習を担当するエンジニアが通っているプロポーザルの秘密を探ります

対象者

  • AIや機械学習の導入に興味のあるPHPer
  • PHPカンファレンスの登壇にチャレンジしたいPHPer

話すこと

  1. テキスト解析をするまでの流れと分析結果
    • Webからのデータ取得
    • 日本語テキストデータの前処理 (正規化・形態素解析など)
    • 通っているプロポーザルと通っていないプロポーザルに出現する単語分布の比較
    • プロポーザルのトピックの分析
  2. プロポーザルの作成
    • OpenAIによるプロポーザル作成
      => 単語やトピックの分析した情報を元にプロポーザルを作成します

話さないこと

  1. 機械学習・統計的手法そのものの仕組み
  2. 日本語以外のテキストの前処理の方法
  3. テキスト以外の前処理の方法