micro-F1入門:機械学習モデルの評価指標
機械学習モデルがどれくらいうまく現実を予測できるのかを評価することは、モデルの精度を高める上でとても大切です。その評価指標として、micro-F1スコアと呼ばれるものがあります。この指標を理解するためには、まず「適合率」と「再現率」という二つの大切な考え方を理解する必要があります。
適合率は、モデルが「正解」と判断したデータのうち、実際にも正解であったデータの割合を示しています。例えば、犬と猫の画像を見分けるモデルがあるとします。このモデルが10枚の画像を「犬」と判断し、そのうち実際に犬の画像は8枚だった場合、適合率は80%となります。つまり、適合率はモデルの予測の確実性を表していると言えます。
一方、再現率は、実際の正解データのうち、モデルがどれだけ正確に「正解」と予測できたかを表す割合です。先ほどの例で言えば、実際に犬の画像は12枚あったとします。そのうちモデルが正しく「犬」と予測できたのは8枚なので、再現率は67%になります。再現率は、モデルが見逃しなく正解データを見つけ出す能力を表していると言えます。
micro-F1スコアは、この適合率と再現率の両方を考慮した指標です。それぞれの指標が突出して高くても、低くても、良いモデルとは言えません。micro-F1スコアは、適合率と再現率の調和を重視し、モデルの総合的な性能を測るために用いられます。