본문 바로가기

Bioinformatics(생정보학)/알고리즘

조건부 확률 (conditional probability)

728x90
반응형

조건부 확률은 서로 연관된 2가지 사건들의 확률을 말한다.

 

예를들어 '영하 1도 날씨에서 눈이 내릴 확률'과 같은 경우이다.

 

이렇게 조건이 있고 어떤 사건이 발생할 확률을 계산하는 것이 조건부 확률이다.

 

위의 영하 1도 날씨란 것과 눈이 내리는 것을 사건 A와 사건 B로 두면 아래의 수식으로 풀어 쓸 수 있다.

 

위의 수식은 '사건 B가 발생했을 때, 사건 A가 발생할 확률'이라는 의미를 갖고 있다.

수식을 통해 알겠지만 P(A|B)는 P(B|A)와 같을 수도 있고 다를 수도 있다.

 

 

1. '영하 1도 날씨에서 눈이 내릴 확률'

2. '눈이 내렸을 때 영하 1도일 확률'

 

두 경우의 확률은 반드시 항상 같은 것은 아니다.

 

간단한 예로 조건부 확률을 계산해보자.

 

어떤 회사에서 구인을 했더니 A대학에서 250명 B대학에서 200명이 왔고 수학과 문학 전공은 각각 280명 170명으로 총 450명의 입사지원자들이 있다.

표로 정리하면 아래와 같다.

 

이런 상황에서 '최종합격자가 수학 전공일 때 A대학일 확률 P(A|M)'을 구한다고 가정해보자.

그러면 수식을 전개하면 아래와 같다.

P(M)은 전체 450명 중 280명이므로 확률이 28/45가 된다. 그리고 A대학일 때 수학전공 (M)일 확률을 구하면 되는데 이것은 450명 중 210명이므로 7/15가 된다. 따라서 전개하면 3/4가 P(A|M)의 확률이 된다.

 

조건부 확률의 계산이 쉬워지는 경우는 2개 사건이 독립 (independence)일 때이다.

독립사건은 두 사건이 함께 일어날 경우 확률값을 단순히 곱을 하면 된다.

 

따라서 독립사건일 때 조건부 확률은 아래로 정리된다.

 

 

그렇다면 P(A)와 P(M)은 독립사건인지 확인해보자.

위의 표대로 계산하면 아래와 같다.

P(A)P(B)의 값이 P(A and M)과 다르므로 독립이 아닌 것을 알 수 있다.

728x90
반응형