Python Machine Learning Ch8
by mmyoji
1 min read
前回 の続き
概要
8章 機械学習の適用1 - 感情分析
映画のレビューデータ(テキスト)を肯定的か否定的か、MLを使って判定する
より実践的なMLの使い方を見ていく、と思う
途中、parameter で l1, l2
と書くべきところがフォントのせいで 11, 12
と読めてハマった。フォント選びくらいちゃんとやってくれ...
用語
- 極性 polarity ... 感情極性とは文にて肯定的な意見を述べているか,否定的な意見を述べているか,あるいは中立的な意見を述べているかといった情報
- 意見マイニング opinion mining ... 感情分析の別名
- BoW Bag-of-Words ... ドキュメントの集合から token (たとえば単語) からなる vocabulary を作成 -> 各ドキュメントでの token の出現回数を含んだ特徴ベクトルを構築
- ワードステミング word stemming ... 単語を原形に変換し、関連する単語を同じ語幹にマッピングできるようにする
- ストップワード ... あらゆる種類のテキストで見られるごくありふれた単語