본론에 앞서

이번 포스트에서는 몇몇 주요한 discrete RV들에 대해서 다뤄보려고 한다.
실제 응용에 있어서 많은 model들을 여기서 소개하게 될 discrete RV들을 통해 modeling할 수 있다.
그만큼 여기서 소개할 내용들이 앞으로의 discrete RV part의 대부분의 중심 내용이 될 것이다.




Bernoulli Random Variable

\\ P_X(x)=\begin{Bmatrix} 1-p & x=0 \\ p & x=1 \\ 0 & otherwise \end{matrix},~~~~~ 0<p<1


PMF가 위와 같은 꼴을 가지는 RV는 Bernoulli RV라고 한다.
일반적으로 Bernoulli(p)와 같은 형태로 간단히 표시할 수 있다.

Success & failure model을 설명하는데 가장 적합한 RV의 형태라고 할 수 있다.
가장 간단한 예로는 동전던지기를 들 수 있다. 앞면과 뒷면이 나올 확률이 동일하다면 p = 1/2로 설정하면 된다.
동전던지기를 나타내는 random variable X는 Bernoulli(1/2)를 따른다고 표현할 수 있다.
'Bernoulli' 대신 'B'로 표기하기도 한다.



Geometric Random Variable

\\ P_X(x)=\begin{Bmatrix} p(1-p)^{x-1} & x=1,2,\dots \\ 0 & otherwise \end{matrix},~~~~~ 0<p<1


PMF가 위와 같은 꼴을 가지는 RV를 Geometric RV라고 한다.
Geometric(p)와 같은 형태로 표시할 수 있다.

Geometric RV는 Bernoulli RV를 갖는 experiment를 성공할 때까지 시행할때 나타나게 된다.
여기서의 x는 시행횟수를 의미한다.
즉 1번만에 experiment를 성공할 확률은 p, 2번만에 성공할 확률은 p(1-p), 3번만에 성공할 확률은 p(1-p)^2이다.
이런 방식으로하면 무한등비수열이 나오게 되는데, 여기서의 1-p는 항상 1보다 작거나 같을 수 밖에 없으므로,
무한등비수열의 합은 수렴하게 되며, 그 값은 물론 1이 된다.
여기서 주목할 점은, geometric RV에서의 '성공'은 항상 1번뿐이라는 것이다.
당연할 수 밖에 없는 것이, 성공을 하는 순간 experiement가 종료되기 때문이다.
이런 관점에서 바라보는것이 다른 RV를 이해하는데에도 꽤 도움이 될 것이다. 



Binomial Random Variable

\\ P_X(x)=\begin{Bmatrix} \begin{pmatrix} n \\ x \end{pmatrix}p^x (1-p)^{n-x} & x=0,1,2,\dots,n \\ 0 & otherwise \end{matrix},~~~~~ 0<p<1,~ n \ge 1


PMF가 위와 같은 꼴을 가지는 RV를 Binomial RV라고 한다.
Binomial(n,p)와 같은 형태로 표시할 수 있다.

Geometric과는 다르게 여기서는 딱 정해진 횟수만큼의 experiment를 시행한다.
그리고 성공한 횟수를 측정한다. PMF는 x번 성공할 확률을 나타낸다.
정리하면, probability p의 Bernoulli experiment를 n번의 시행하여 x번의 성공을 할 확률을 나타낸다. 
즉, 여기서의 x는 성공한 횟수를 의미한다. Geometric RV의 x가 experiment 횟수를 나타내는 것과 다르다.
헷갈리지 않도록 주의한다.

여기서 한가지 주목할 점은 여기서의 n = 1 의 case가 곧 Bernoulli RV가 된다는 점이다.




Pascal Random Variable

\\ P_X(x)=\begin{Bmatrix} \begin{pmatrix} x-1 \\ k-1 \end{pmatrix}p^k (1-p)^{x-k} & x=k,k+1,\dots \\ 0 & otherwise \end{matrix},~~~~~ 0<p<1,~ k \ge 1


PMF가 위와 같은 꼴을 가지는 RV를 Pascal RV라고 한다.
Pascal(k,p)와 같은 형태로 표시할 수 있다. 

이번 experiment는 geometric과 binomial RV를 다시 한 번 결합한 형태다.
쉽게 이야기하면 시행이 k번 성공할 때 까지 experiment를 계속할 때의 확률을
Pascal RV의 PMF를 통해 구할 수 있다.

위 식에 보이는 combination을 보면 x-1, k-1이 쓰여 있는데,
만약 x번째 시행에서 k번째 성공이 나오게 된다면, x-1번째 시행까지는 k-1번의 성공이 있게 되는 것이다.
k-1번의 성공이 그동안에 어떻게 어떻게 배치되느냐의 문제가 되므로 combination을 통해 나타낼 수 있고,
combination의 형태는 위와 같이 쓸 수 있는 것이다.

한편, Geometric(p)의 경우 Pascal(1,p) 와 동일하다.
1번의 성공이 있을 때 까지 시행을 계속하는 것이기 때문이다.



Discrete Uniform Random Variable

\\ P_X(x)=\begin{Bmatrix}1/(l-k+1) & x=k,k+1,k+2,\dots ,l \\ 0 & otherwise \end{matrix},~~~~~ k < l


PMF가 위와 같은 꼴을 가지는 RV를 Discrete Uniform RV라고 한다.
Discrete Uniform(k,l)와 같은 형태로 표시할 수 있다.

이는 모든 outcome이 동일한 확률로 분포되어있는 경우에 사용된다.
l-k+1은 outcome의 개수를 나타내고 있으며, k부터 l까지 1 단위로 커진다.
만약 outcome이 이와 다른 패턴 (예를 들어 0, 2, 4, 6... 같은) 을 가진다면 위와 같은 형태로 normalize 해야한다.

위에서 소개했던 Bernoulli RV와 별 관련이 없다.



Poisson Random Variable

\\ P_X(x)=\begin{Bmatrix} \alpha^x e^{-\alpha}/x! & x=0,1,2,\dots \\ 0 & otherwise \end{matrix},~~~~~ \alpha > 0


PMF가 위와 같은 꼴을 가지는 RV를 Poisson RV라고 한다.
Poisson(α)와 같은 형태로 표시할 수 있다.

Poisson은 '포아송' 이라고 읽는다.
포아송 분포는 시간과 사건의 발생횟수의 평균에 관한 정보를 알고 있을 때,
특정 시간동안 사건이 몇 번 발생할 것인가에 대한 확률 정보를 나타낸다.
이를 토대로 α를 설정할 수 있다.

이론만 가지고는 설명하기가 까다로운데, 예를 들면 이런 것이다.
어떤 소방서에 1시간동안 평균적으로 30건의 전화가 온다고 하자.
Poisson RV를 이용하면 이 소방서에 10분동안 전화가 x번 올 확률을 PMF를 통해 구할 수 있다.

α의 설정은 다음과 같이 할 수 있다.
평균 발생횟수를 λ라고 하고, 우리가 원하는 시간간격을 T라고 한다면 위의 예제에서는
1시간을 기준으로 삼았을 때, 평균 발생횟수는 30회가 되고, 우리는 10분동안 전화가 올 확률을 원하므로 

T = 1/6으로 설정할 수 있다. (10분을 시간으로 표현하면 1/6시간이다.)

α =  λT와 같이 구할 수 있다. 즉, 예제에서의 α는 5가 된다.
이 수치를 식에 집어넣은 것이 곧 Poisson RV의 PMF가 되는 것이다.

물론 이 소방서에는 10분동안 통화가 한건도 오지 않을 수도 있고, 30건이 넘게 올 수도 있다.
우리는 그것을 확정지을 수 없지만, Poisson model을 통해 확률이 어떤 분포를 갖는지 살펴 볼 수 있게 되는 것이다.
이로서 6가지의 중요한 RV에 대해 살펴 보았다.


Posted by Nicatio

댓글을 달아 주세요

  1. Kou 2012.06.17 10:46 신고  수정/삭제 댓글쓰기

    Binomial 에서 n=1 일때, Bernoulli Random Variable 의 형태가 되는것 아닌가요?
    저도 처음에 Binomial 과 Geometric 사이에 어떤 관계가 있지않을까.. 생각했는데,
    x=1로 두고 n을 x로 치환해도 xC1*p*(1-p)^x가 나와서 앞에 계수 x가 붙어버리더라구요..