Python Machine Learning Ch6

by mmyoji

1 min read

前回 の続き

案の定内容が微妙ですね、ということになったので、せめて実践的(そう)なアプリケーションを作る章だけやるか、ということになり、6, 7章はスキップすることになった。

簡単に新しい概念やキーワードのみメモを残しておく

概要

第6章 モデルの評価とハイパーパラメータのチューニングのベストプラクティス

パイプラインとかグリッドサーチとか

ホールドアウト法

holdout method

聞いたことがなかったのでメモ

  • モデルの汎化性能を評価するのに使う
  • データを training, test じゃなく、 training, verification, test に分割

このアプローチ自体は知ってたは

k分割交差検証

training dataset の k 個のサブセットに対して、ホールドアウト法を k 回繰り返す

false positive, false negative

復習

  • false positive FP ... 実際は negative なのに、 positive と判定されてしまう
  • false negative FN ... 実際は positive なのに、 negative と判定されてしまう

後ろの単語が「xxx と判定された」という予測された結果で、それが false と覚えておく(なんかもっとマシな覚え方ありそう)

適合率、再現率、F1スコア

  • 適合率 Precision ... PRE = TP / (TP+FP)
  • 再現率 Recall ... REC = TP/P = TP/(FN+TP)
  • F1スコア F1-score ... F1 = 2 * (PRE*REC) / (PRE+REC)