728x90
반응형
1. 개요
분류 오차는 최대 사후확률 p(Ck|x)가 1 (unity)보다 매우 작거나, 비슷한 값들을 갖는 p(x,Ck)의 결합 분포인 입력 공간에서 발생한다. 이러한 영역들은 우리가 클래스 멤버쉽에 대해 상대적으로 불확실하게 생각하는 공간이다.
2. 내용
- 몇가지 상황에서는 해당 공간에 대한 결정을 안하는 것이 적절할 수 있다. 이를 통해 결정이 이루어졌을 때 오류률을 낮출 것을 기대할 수도 있다. 이것이 거부 선택 (reject option)이라 알려져 있다.
- 예를들어, X-ray 이미지를 통해 환자를 분류할 때 확신할 수 있을 경우에는 자동으로 분류하는 것이 좋지만 애매한 경우에는 인간 전문가가 직접 개입해야 좋을 수 있다. 이것을 하는 방법은 적절한 역치값 (threshold)를 지정하는 것이다. 입력 x에 대해 최대의 사후확률 p(Ck|x)가 지정된 값 (theta) 미만이거나 0일 경우에 적용하는 식으로 우리는 거부 선택을 할 수 있다.
- 이것은 그림 1.26에 단일 변수 x에 대해 표현되어 있다. theta=1인 경우는 모든 예제가 거부되며 theta < 1/K의 경우 어떤 예제도 거부되지 않는다. 따라서, 샘플이 거부되는 비율은 theta에의해 조절된다. 우리는 거부 기준치를 평균 오차 를 최소화하기 위해 쉽게 확장해 적용할 수 있다. 이는 거부 선택이 일어났을 때 생기는 오차를 고려한 오차 행렬이 주어지면 된다.
728x90
반응형
'DeepLearning > Pattern recognition and Machine learning' 카테고리의 다른 글
[PRML] 1.5.5 Loss functions for regression (회귀에 대한 손실함수들) (0) | 2024.01.12 |
---|---|
[PRML] 1.5.4 Inference and decision (추론과 결정) (0) | 2024.01.11 |
[PRML] 1.5.2 Minimizing the expected loss (기대 오차 최소화하기) (0) | 2024.01.10 |
[PRML] 1.5.1 Minimizing the misclassification rate (잘못된 분류율 최소화하기) (0) | 2024.01.09 |
[PRML] 1.5. Decision Theory (결정 이론) (0) | 2024.01.08 |