[PRML] 1.5.3 The reject option (거부 옵션)

728x90

분류 오차는 최대 사후확률 p(Ck|x)가 1 (unity)보다 매우 작거나, 비슷한 값들을 갖는 p(x,Ck)의 결합 분포인 입력 공간에서 발생한다. 이러한 영역들은 우리가 클래스 멤버쉽에 대해 상대적으로 불확실하게 생각하는 공간이다.

몇가지 상황에서는 해당 공간에 대한 결정을 안하는 것이 적절할 수 있다. 이를 통해 결정이 이루어졌을 때 오류률을 낮출 것을 기대할 수도 있다. 이것이 거부 선택 (reject option)이라 알려져 있다.
예를들어, X-ray 이미지를 통해 환자를 분류할 때 확신할 수 있을 경우에는 자동으로 분류하는 것이 좋지만 애매한 경우에는 인간 전문가가 직접 개입해야 좋을 수 있다. 이것을 하는 방법은 적절한 역치값 (threshold)를 지정하는 것이다. 입력 x에 대해 최대의 사후확률 p(Ck|x)가 지정된 값 (theta) 미만이거나 0일 경우에 적용하는 식으로 우리는 거부 선택을 할 수 있다.
이것은 그림 1.26에 단일 변수 x에 대해 표현되어 있다. theta=1인 경우는 모든 예제가 거부되며 theta < 1/K의 경우 어떤 예제도 거부되지 않는다. 따라서, 샘플이 거부되는 비율은 theta에의해 조절된다. 우리는 거부 기준치를 평균 오차 를 최소화하기 위해 쉽게 확장해 적용할 수 있다. 이는 거부 선택이 일어났을 때 생기는 오차를 고려한 오차 행렬이 주어지면 된다.

728x90

[PRML] 1.5.5 Loss functions for regression (회귀에 대한 손실함수들) (0)	2024.01.12
[PRML] 1.5.4 Inference and decision (추론과 결정) (0)	2024.01.11
[PRML] 1.5.2 Minimizing the expected loss (기대 오차 최소화하기) (0)	2024.01.10
[PRML] 1.5.1 Minimizing the misclassification rate (잘못된 분류율 최소화하기) (0)	2024.01.09
[PRML] 1.5. Decision Theory (결정 이론) (0)	2024.01.08

통통세알