Python Machine Learning Ch8

by mmyoji

1 min read

前回 の続き

概要

8章 機械学習の適用1 - 感情分析

映画のレビューデータ(テキスト)を肯定的か否定的か、MLを使って判定する

より実践的なMLの使い方を見ていく、と思う

途中、parameter で l1, l2 と書くべきところがフォントのせいで 11, 12 と読めてハマった。フォント選びくらいちゃんとやってくれ...

用語

  • 極性 polarity ... 感情極性とは文にて肯定的な意見を述べているか,否定的な意見を述べているか,あるいは中立的な意見を述べているかといった情報
  • 意見マイニング opinion mining ... 感情分析の別名
  • BoW Bag-of-Words ... ドキュメントの集合から token (たとえば単語) からなる vocabulary を作成 -> 各ドキュメントでの token の出現回数を含んだ特徴ベクトルを構築
  • ワードステミング word stemming ... 単語を原形に変換し、関連する単語を同じ語幹にマッピングできるようにする
  • ストップワード ... あらゆる種類のテキストで見られるごくありふれた単語

References