Intro...
Bayes Rule은 어떤 값을 예측하기 위한 수단으로서 여러 분야에서 널리 사용되는 개념으로 통계학을 공부한 사람이라면 대부분 들어보셨을 만한 유명한 정리이다. 이번 포스트에서는 이 Bayes Rule에 대해 간단히 살펴보고, 수식의 Notation들이 각각 무엇을 의미하는지 알아보도록 한다.

Bayes Rule을 설명하기 위해 농어(Sea Bass)와 연어(Salmon)를 구분하는 문제를 예로 많이 든다. 먼저 농어와 연어를 구별하기 위해서 우리가 할 일은 간단하다. 낚시를 통해 건져 올린 물고기를 보고 농어인지 연어인지 맞추기만 하면 된다. 이 때 우리는 물고기를 분류하는 기준세워야 하는데 피부의 밝기로 구분해보자. 즉 우리가 물고기의 피부 밝기 정보를 이용해서 그 물고기가 농어인지 연어인지 맞추는 Task를 진행한다.
수식적 표현
우리는 물고기의 피부 밝기 정보가 주어졌을 때 그 물고기가 농어인지 연어인지 맞추기 위해서 이 문제를 수학적으로 모델링 할 것이다. 먼저 우리에게 주어진 물고기의 피부 색의 밝기를
만약 우리에게 만약 모든
라면 농어로 분류한다.P(w1|x)>P(w2|x) 라면 연어로 분류한다.P(w2|x)>P(w1|x)
이는 단순히 물고기가 농어일 확률이 높으면 농어, 연어일 확률이 높으면 연어로 분류하자는 전략이다. 그렇다면 물고기 분류 문제는
관찰하기
그렇다면 우리는 Posterior, 즉

분포를 해석해보면, 농어의 피부 밝기가 전체적으로 연어에 비해 밝다는 사실을 알 수 있다. 이렇게 우리는 Likelihood를 얻었다. 그리고 Likelihood의 그래프를 보고 이런 생각이 들 수 있다. 그냥 지금 가지고 있는 Likelihood 분포에서 두 곡선이 만나는 지점의
Prior
지금까지 알아본 사실들을 간단히 정리해보자. 물고기의 피부 밝기
결론은,
Bayes’ Rule
지금까지 우리는 세 가지 종류의 확률을 알아봤다. 정리해보도록 하자.
- Posterior(
): 피부 밝기(P(wi|x) )가 주어졌을 때 그 물고기가 농어일 확률 또는 연어일 확률. 즉 단서가 주어졌을 때, 대상이 특정 클래스에 속할 확률. 우리가 최종적으로 구해야 하는 값이다.x - Likelihood(
): 농어 또는 연어의 피부 밝기(P(x|wi) )가 어느 정도로 분포되어 있는지의 정보. 즉 각 클래스에서 우리가 활용할 단서가 어떤 형태로 분포 돼 있는지를 알려준다. Posterior를 구하는 데 있어서 매우 중요한 단서가 된다.x - Prior(
): 피부 밝기(P(wi) )에 관계 없이 농어와 연어의 비율이 얼마나 되는지의 값. 보통 사전 정보로 주어지거나, 주어지지 않는다면 연구자의 사전 지식을 통해 정해줘야 하는 값이다.x
우리의 목적은 Posterior(
그리고 이를 살짝 변형하면 다음과 같은 식을 얻을 수 있다.
그리고
좌변은 우리가 구하고자 하는 Posterior이고, 우변의 분자는 Likelihood와 Prior의 곱이며, 우변의 분모는 Evidence라고 보통 부르는데, 이 또한 Likelihood와 Prior들을 통해 구할 수 있다. 즉 우리는 이 식을 이용하면 Posterior를 구할 수 있고, 이 식을 우리는 Bayes’ Rule또는 Bayesian Equation 등으로 부른다.

위 그래프는 방금 알아 본 Bayes’ Rule에 따라 농어와 연어의 Posterior를 구한 결과이다. 이제 우리는
'지식공학 > 공학수학' 카테고리의 다른 글
KL Divergence/JSD (0) | 2021.05.27 |
---|---|
2차 미분방정식(Second Order Linear ODEs) 이해 (0) | 2020.11.09 |
1차 상미분방정식(First Oder Differential Equations) 이해 (0) | 2020.11.04 |
댓글