Python Machine Learning Ch6
by mmyoji
1 min read
前回 の続き
案の定内容が微妙ですね、ということになったので、せめて実践的(そう)なアプリケーションを作る章だけやるか、ということになり、6, 7章はスキップすることになった。
簡単に新しい概念やキーワードのみメモを残しておく
概要
第6章 モデルの評価とハイパーパラメータのチューニングのベストプラクティス
パイプラインとかグリッドサーチとか
ホールドアウト法
holdout method
聞いたことがなかったのでメモ
- モデルの汎化性能を評価するのに使う
- データを training, test じゃなく、 training, verification, test に分割
このアプローチ自体は知ってたは
k分割交差検証
training dataset の k 個のサブセットに対して、ホールドアウト法を k 回繰り返す
false positive, false negative
復習
- false positive FP ... 実際は negative なのに、 positive と判定されてしまう
- false negative FN ... 実際は positive なのに、 negative と判定されてしまう
後ろの単語が「xxx と判定された」という予測された結果で、それが false と覚えておく(なんかもっとマシな覚え方ありそう)
適合率、再現率、F1スコア
- 適合率 Precision ...
PRE = TP / (TP+FP)
- 再現率 Recall ...
REC = TP/P = TP/(FN+TP)
- F1スコア F1-score ...
F1 = 2 * (PRE*REC) / (PRE+REC)