728x90
반응형
1. 개요
앞서봤던 수식 2.34의 다항분포의 파라미터 {u_k}에대한 사전확률 중 하나인 디리클레 분포 (Dirichlet distribution)를 살펴보겠다.
2. 내용
- 다항분포의 형태를 탐구하면 결합 사전 분포 (conjugate piror)는 수식 2.37로 주어지는 것을 볼 수 있다.
여기서 0 <= u_k <=1 그리고 u_k의 총합은 1이다. a_1,...,a_k는 분포의 파라미터들로 a 는 (a_1,...,a_k)T이다. 알아둬야할 사항으로는 총합 제한 (the summation of constraint) 때문에, {u_k}의 공간에 대한 분포는 K - 1차원의 심플렉스 (simplex)에 제한된다는 것이다. 이는 그림 2.4의 K=3에서 볼 수 있다.
심플렉스 (simplex) : 기하학에서 심플렉스라는 개념은 인위적인 공간들에서 삼각형 또는 테트라헤드론 (tetrahedron)의 개념을 일반화하는 것을 의미한다. 이것은 어떤 주어진 차원에 대해 가장 단순한 폴리토프 (the simplest possible polytope)를 나타낸다. 구체적으로 k-simplex는 k차원의 폴리토프인데 K+1개의 꼭지점들의 컨벡스 훌 (convex hull)이다.
- 이 분포의 표준화된 형태 (normalized form for this distribution)은 수식 2.38로 나타내며 이것이 디리클레 분포 (Dirichlet distribution)이다. Γ(x)는 감마 함수 (gamma function)으로 수식 1.141에 정의되어 있고 2.39를 만족해야한다. a_k에 대한 다양한 셋팅들에 대한 심플렉스의 디리클레 분포는 그림 2.5와 같다.
- 사전분포 (2.38)을 가능도 함수 (2.34)로 곱셈을 하면, u_k에 대한 사후확률 분포를 수식 2.40으로 얻을 수 있다.
- 사후확률은 디리클레 분포의 형태를 가지는 것을 볼 수 있다. 디리클레 분포는 실제로 다변량에대한 결합 사전확률이다. 이것은 수식 2.38과의 비교를 통해 표준화 상수 (normalization coefficient)를 결정하는 것을 가능하게 한다. 수식 2.41에서 m = (m_1,....,m_k)T 이다. 베타 사전 분포 (beta prior)에 대한 이항분포의 경우, 디리클레 사전분포의 a_k를 x_k=1이라는 관측값의 효과적인 숫자 (an effective number of observations of x_k=1)로서 해석할 수 있다.
- 알아둘 점은 2개의 상태량 (two-state quantities)는 이진 변수로서 표현되어 이항분포 (2.9)로 모델링 되거나 혹은 1-of-2 변수들로서 K=2라는 다변량 분포 (multinomial distribution, 2.34)로 모두 표현이 가능하다.
728x90
반응형
'DeepLearning > Pattern recognition and Machine learning' 카테고리의 다른 글
[PRML] 2.2. Multinomial variables (다변량 변수) (0) | 2024.02.27 |
---|---|
[PRML] 2.1.1 The beta distribution (베타 분포) (0) | 2024.02.06 |
[PRML] 2.1. Binary variables (이진 변수들) (0) | 2024.02.01 |
[PRML] 2. Probability distributions (확률 분포들) (0) | 2024.01.26 |
[PRML] 1.6.1 Relative entropy and mutual information (상대 엔트로피와 상호 의존 정보) (0) | 2024.01.23 |