본문 바로가기

Bioinformatics(생정보학)/알고리즘

베이지언 통계의 개념

728x90
반응형

이 글은 베이지언이 개념을 수학수식 없이 간단하게 소개하기 위한 글이다.

 

통계학은 불확실성에 대한 학문이다.

 

그리고, 이 불확실하다는 것을 정량화 한 것이 확률이다.

 

우리가 주사위를 굴렸을 때 숫자가 짝수일지 홀수일지 예측하는 것, 자동차 사고가 날지 예측하는 것, 내일 비가 올지 안올지 등을 예측할 때 모두 확률이 사용된다.

 

 

이런 문제들에 대해 3가지 통계접근법이 있다.

고전 (classical), 빈도 (frequentist) 그리고 베이지언 (bayesian)이다.

 

고전적인 방식

먼저 고전적인 방식은 사건들의 발생확률이 거의 동일하다고 (equally likely) 전제하는 것이다.

주사위가 조작되지 않았다면 1부터 6에 이르는 숫자들이 주사위 윗면에 나올 확률이 동일하다.

또는 동전과 같이 앞/뒤가 동일하게 나온다고 가정하는 것들이 바로 고전적인 접근방식이다.

 

빈도주의적 접근

빈도주의적인 접근방식은 '수 많은 반복 시행속에 구해지는 사건들간의 상대적 빈도 (relative frequency)를 확률'로 정의한다.

차량사고와 같이 '사고가 날 확률'과 '사고가 안 날 확률'은 서로 다른 경우가 빈도주의적인 접근방식으로 계산되는 것이다. 차량의 수는 수 백만대이니 이것은 '수 많은 반복'에 해당한다. 이를통해 사고가 난 차량의 상대적 빈도를 구해 사고확률을 구하는 것이다.

베이지언 접근법

마지막으로 베이지언 접근방식에서 확률은 '지식 또는 믿음의 정도 (personal eprspective)를 나타내는 양'으로 해석한다.

예를들어 '내일 비가 올지 안올지를 예측'하는 문제를 푼다고 가정해보자.

비가 올지 안올지는 고전주의 방식처럼 50:50의 방식이 아닐 것이다. 또한, 빈도주의 방식처럼 수 많은 반복시행을 위해 '수 많은 내일'을 가정할 수도 없다. 우리는 오늘의 정보로 내일을 예측해야한다.

 

기온, 습도와 오늘 날씨가 맑았는지 아닌지 등이 내일 비가 올지에대한 정보가 된다.

오늘의 '사전확률'이 내일의 비가 올지에대한 '사후확률'에 영향을 준다고 가정하는 것이 베이지언 접근법이다.

728x90
반응형