ROC 커브는 이진 분류 모델의 성능을 표현하는 지표이며, 가능한 모든 threshold에 대해 FPR과 TPR의 비율을 표현한 것이다.
ROC 커브가 좌상단에 붙어있을 수록(FPR은 낮게, TPR은 높게) 더 좋은 이진 분류 모델이다.
- TPR과 FPR의 관계?
(모델의 성능은 아래 분포와 같이 고정되어있다.)
- 의사가 감기 진단을 하는데 내원자들을 감기 환자로 판정하는 경향이 높다고 하자 (== Threshold ↓)
Threshold를 낮게 한다면
- 실제 감기 환자들을 감기 환자라고 진단하는 경우는 높아지고(TPR ↑)
- 실제 감기에 걸리지 않은 환자들도 감기 환자라고 진단하는 경우가 많이진다. (FPR ↑)
2. 의사가 감기 진단을 하는데 내원자들을 감기 환자가 아니라고 판정하는 경향이 높다고 하자 (==Threshold ↑)
Threshold를 높게 한다면 실제 감기 환자든 아니던 정상인으로 판정하는 경우가 많아진다. 따라서 TPR과 FPR이 모두 낮아진다.
⇒ Threshold가 높아질수록 TPR과 FPR은 함께 비례적으로 낮아지고, Threshold가 낮아질수록 TPR과 FPR은 함께 비례적으로 높아진다.
https://angeloyeo.github.io/2020/08/05/ROC.html