[Discrete RV] Named Types of Discrete RV
2012. 2. 5. 01:20
본론에 앞서
이번 포스트에서는 몇몇 주요한 discrete RV들에 대해서 다뤄보려고 한다.
실제 응용에 있어서 많은 model들을 여기서 소개하게 될 discrete RV들을 통해 modeling할 수 있다.
그만큼 여기서 소개할 내용들이 앞으로의 discrete RV part의 대부분의 중심 내용이 될 것이다.
Bernoulli Random Variable
PMF가 위와 같은 꼴을 가지는 RV는 Bernoulli RV라고 한다.
일반적으로 Bernoulli(p)와 같은 형태로 간단히 표시할 수 있다.
Success & failure model을 설명하는데 가장 적합한 RV의 형태라고 할 수 있다.
가장 간단한 예로는 동전던지기를 들 수 있다. 앞면과 뒷면이 나올 확률이 동일하다면 p = 1/2로 설정하면 된다.
즉 동전던지기를 나타내는 random variable X는 Bernoulli(1/2)를 따른다고 표현할 수 있다.
'Bernoulli' 대신 'B'로 표기하기도 한다.
Geometric Random Variable
PMF가 위와 같은 꼴을 가지는 RV를 Geometric RV라고 한다.
Geometric(p)와 같은 형태로 표시할 수 있다.
Geometric RV는 Bernoulli RV를 갖는 experiment를 성공할 때까지 시행할때 나타나게 된다.
여기서의 x는 시행횟수를 의미한다.
즉 1번만에 experiment를 성공할 확률은 p, 2번만에 성공할 확률은 p(1-p), 3번만에 성공할 확률은 p(1-p)^2이다.
이런 방식으로하면 무한등비수열이 나오게 되는데, 여기서의 1-p는 항상 1보다 작거나 같을 수 밖에 없으므로,
무한등비수열의 합은 수렴하게 되며, 그 값은 물론 1이 된다.
여기서 주목할 점은, geometric RV에서의 '성공'은 항상 1번뿐이라는 것이다.
당연할 수 밖에 없는 것이, 성공을 하는 순간 experiement가 종료되기 때문이다.
이런 관점에서 바라보는것이 다른 RV를 이해하는데에도 꽤 도움이 될 것이다.
Binomial Random Variable
PMF가 위와 같은 꼴을 가지는 RV를 Binomial RV라고 한다.
Binomial(n,p)와 같은 형태로 표시할 수 있다.
Geometric과는 다르게 여기서는 딱 정해진 횟수만큼의 experiment를 시행한다.
그리고 성공한 횟수를 측정한다. PMF는 x번 성공할 확률을 나타낸다.
정리하면, probability p의 Bernoulli experiment를 n번의 시행하여 x번의 성공을 할 확률을 나타낸다.
즉, 여기서의 x는 성공한 횟수를 의미한다. Geometric RV의 x가 experiment 횟수를 나타내는 것과 다르다.
헷갈리지 않도록 주의한다.
여기서 한가지 주목할 점은 여기서의 n = 1 의 case가 곧 Bernoulli RV가 된다는 점이다.
Pascal Random Variable
PMF가 위와 같은 꼴을 가지는 RV를 Pascal RV라고 한다.
Pascal(k,p)와 같은 형태로 표시할 수 있다.
이번 experiment는 geometric과 binomial RV를 다시 한 번 결합한 형태다.
쉽게 이야기하면 시행이 k번 성공할 때 까지 experiment를 계속할 때의 확률을
Pascal RV의 PMF를 통해 구할 수 있다.
위 식에 보이는 combination을 보면 x-1, k-1이 쓰여 있는데,
만약 x번째 시행에서 k번째 성공이 나오게 된다면, x-1번째 시행까지는 k-1번의 성공이 있게 되는 것이다.
k-1번의 성공이 그동안에 어떻게 어떻게 배치되느냐의 문제가 되므로 combination을 통해 나타낼 수 있고,
combination의 형태는 위와 같이 쓸 수 있는 것이다.
한편, Geometric(p)의 경우 Pascal(1,p) 와 동일하다.
1번의 성공이 있을 때 까지 시행을 계속하는 것이기 때문이다.
Discrete Uniform Random Variable
PMF가 위와 같은 꼴을 가지는 RV를 Discrete Uniform RV라고 한다.
Discrete Uniform(k,l)와 같은 형태로 표시할 수 있다.
이는 모든 outcome이 동일한 확률로 분포되어있는 경우에 사용된다.
l-k+1은 outcome의 개수를 나타내고 있으며, k부터 l까지 1 단위로 커진다.
만약 outcome이 이와 다른 패턴 (예를 들어 0, 2, 4, 6... 같은) 을 가진다면 위와 같은 형태로 normalize 해야한다.
위에서 소개했던 Bernoulli RV와 별 관련이 없다.
Poisson Random Variable
PMF가 위와 같은 꼴을 가지는 RV를 Poisson RV라고 한다.
Poisson(α)와 같은 형태로 표시할 수 있다.
Poisson은 '포아송' 이라고 읽는다.
포아송 분포는 시간과 사건의 발생횟수의 평균에 관한 정보를 알고 있을 때,
특정 시간동안 사건이 몇 번 발생할 것인가에 대한 확률 정보를 나타낸다.
이를 토대로 α를 설정할 수 있다.
이론만 가지고는 설명하기가 까다로운데, 예를 들면 이런 것이다.
어떤 소방서에 1시간동안 평균적으로 30건의 전화가 온다고 하자.
Poisson RV를 이용하면 이 소방서에 10분동안 전화가 x번 올 확률을 PMF를 통해 구할 수 있다.
α의 설정은 다음과 같이 할 수 있다.
평균 발생횟수를 λ라고 하고, 우리가 원하는 시간간격을 T라고 한다면 위의 예제에서는
1시간을 기준으로 삼았을 때, 평균 발생횟수는 30회가 되고, 우리는 10분동안 전화가 올 확률을 원하므로
T = 1/6으로 설정할 수 있다. (10분을 시간으로 표현하면 1/6시간이다.)
α = λT와 같이 구할 수 있다. 즉, 예제에서의 α는 5가 된다.
이 수치를 식에 집어넣은 것이 곧 Poisson RV의 PMF가 되는 것이다.
물론 이 소방서에는 10분동안 통화가 한건도 오지 않을 수도 있고, 30건이 넘게 올 수도 있다.
우리는 그것을 확정지을 수 없지만, Poisson model을 통해 확률이 어떤 분포를 갖는지 살펴 볼 수 있게 되는 것이다.
이로서 6가지의 중요한 RV에 대해 살펴 보았다.