Transforming Classifier Scores into Accurate Multiclass Probability Estimates
Zadrozny and Elkan, “Transforming classifier scores into multiclass probability estimates”, SIGKDD‘02 (http://www.research.ibm.com/people/z/zadrozny/kdd2002-Transf.pdf) を読んだ。なぜ読んだかというと、Scikit-learnのSGDClassifierに関するドキュメント(http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.SGDClassifier.html)で複数のone-vs-restの二値分類器の出力を用いて多クラス分類において各クラスに属する確率を推定する方法として参照されていて興味を持ったため。
この論文では分類問題に置ける各クラスの確率の推定のための二つの手法を提案している。
- calibrationされた二値分類問題の各クラスへの所属確率の推定値を各データ点に対するスコア(確率とは限らない)から推定
- 多クラス分類問題での各クラスの確率を複数の二値分類問題での確率の推定値を用いて計算