心理學和機器學習中的 Accuracy、Precision、Recall Rate 和 Confusion Matrix
心理學家用生動的故事帶你快速掌握讓人混淆的混淆矩陣!這篇會努力都用中文打,介紹統計中重要的準確率、精確率和召回率,再從心理學到機器學習的應用,讓我們先從日常生活的角度出發,了解為什麼需要混淆矩陣吧!
一般人生活中常用的是準確率,從小考試的分數就是準確率,考卷 100 題裡答對 95 題,你的準確率就是 95%。
那為什麼會需要精確率和召回率呢?
如果今天有一個老師,他出的考卷 100 題有 99 題的答案都是 C ,如果你知道這件事,以後遇到這個老師出的考卷你就全部猜 C ,雖然你不一定有唸書,但每次都可以考 99 分上下,這時候準確率就不是一個好的衡量方法。
再舉一個資料科學中的例子,如果你要做出一個判斷垃圾郵件的模型,你已經知道 100 封郵件中有 2% 是垃圾郵件,你想要寫一個準確率很高的模型,直接設定所有郵件都非垃圾郵件即可,你的模型準確率就會高達 98% ,聽起來很厲害,皆大歡喜,但其實你的模型在判斷垃圾郵件上一點功用都沒有。
準確率的限制在這種情況就很明顯,如果你要判斷的情況及資料是不均衡狀態(imbalance)的時候,除了準確率之外,還要考慮精確率(precision)和召回率(recall rate)就非常重要了。
之前念心理系時每天都在算的型一錯誤(type one error)和型二錯誤(type two error),在 machine learning 領域其實是一樣的概念,只是應用不同而有了新的名字 — Confusion Matrix。看到眾多老外表示真的很 Confusing 啊!
我們就先回到平易近人的心理學,重新出發吧!
在心理學實驗中,如果受試者要對某個訊號做出反應(舉例來說按下按鈕好了),總共會有以下四種可能:
- 訊號出現且受試者按下按鈕(Hit)
- 訊號出現且受試者沒按下按鈕(Miss)
- 訊號沒出現且受試者按下按鈕(False alarm)
- 訊號沒出現且受試者沒按下按扭(Correct Reject)