메뉴
[Continuous RV] Named Types of Continuous RV

2012. 2. 15. 20:10

Uniform Random Variable

f_X(x)=\begin{cases} 1/(b-a) & a \leq x < b \\ 0 & otherwise, \end{cases} ~~~~~where~ b>a

 
위와 같은 PDF를 가진 continuous RV를 uniform (a, b) RV 라고한다.
이전의 원판위에서 포인터 돌리기 예제를 일반화 한 것이라고 볼 수 있다.
일반적으로 a, b는 어떤 constant이므로, 1/(b-a) 역시 constant값이 된다.
따라서 CDF의 그래프는 일정한 기울기를 갖게된다.

이전의 continuous RV의 정리를 이용해서 다음의 정리를 얻을 수 있다.


한편 continuous RV와 discrete RV관계는 직접적인 관계를 갖는 것들이 꽤 많다.
X를 uniform (a, b) RV라고 하고, K를 다음과 같다고 하자.

K = \left\lceil X \right\rceil


여기서 나타난 X 양옆의 기호는 이전에 설명했던 ceil (올림)이다. 
이 때의 X는 discrete random (a+1, b) RV가 된다.

어떤 P[K = k], 즉 discrete random RV의 어떤 outcome 하나가 발생할 확률은
uniform RV의 PDF의 해당 범위를 적분한 것과 같다.
즉 K = k가 될 수 있는 X의 범위는 k-1 ≤ x < k 이고, 확률은 모든 구간에서 일정하므로, 식으로 써보면,

P[K=k]=P_K(k)=\int_{k-1}^{k} P_X(x)dx = \begin{cases}1/(b-a)&k=a+1,a+2, \cdots,b \\ 0&otherwise \end{cases}


위와 같이 쓸 수 있다. 



Exponential Random Variable

f_X(x) = \begin{cases}\lambda e^{-\lambda x} & x \ge 0 \\ 0 & otherwise \end{cases}, ~~~~~where ~\lambda>0


위와 같은 PDF를 가진 continuous RV를 exponential (λ) RV 라고 한다. 
어떤 experiment에 대해 평균에 대한 데이터를 이미 가지고 있는 상황을 모델링할때 사용되는 RV인데, 
다음의 예제를 보면 이해가 빠를 것 같다.



예제


F_T(t) = \begin{cases} 1-e^{-t/3} & t \ge 0 \\ 0 & otherwise \end{cases}


전화가 t분 동안 지속될 확률 모델을 보통 exponential RV로 나타내 볼 수 있다.
통화 시간을 t분이라고하고, CDF가 위와 같이 주어진 어떤 continuous RV T가 있을 때,
전화가 2~4분 동안 지속될 확률은 얼마인가?

이 문제에서는 굳이 PDF를 구할 필요는 없으나 연습 삼아 PDF를 구해보도록 하자.
간단히 미분을 통해서 f_T(t)를 구하면,

f_T(t)= \frac{dF_T(t)}{dt} = \begin{cases} (1/3)e^{-t/3} & t \ge 0 \\ 0 & otherwise \end{cases}


위와 같다. 위와 같은 문제는 일반적으로 CDF든 PDF든 2가지 모두를 구하지 않아도 답을 얻을 수 있다.
CDF를 이용해서 문제를 풀려면 그냥 함수값의 차이를 구하면 되고,
PDF를 이용해서 문제를 풀려면 함수를 해당 구간만큼 적분하면 된다.
어찌 되었든 둘 다 같은 결과를 얻게 된다. 식을 통해 보면,

P[2 \leq T \leq 4] = \int_2^4 f_T(t) dt = F_4(4) - F_2(2) = e^{-2/3}-e^{-4/3} \approx 0.250


위와 같다. 통화시간이 2~4분 사이에 있을 확률이 약 1/4가 됨을 알 수 있다.



일반적으로 exponential RV에 대해서 다음이 성립한다.

\begin{array}{rl} (a)& F_X(x) = \begin{cases} 1-e^{-\lambda x} & x \ge 0 \\ 0 & otherwise \end{cases}\\ (b) & E[X] = 1/\lambda \\ (c) & Var[X] = 1/\lambda^2 \\ \end{array}


(a)의 경우는 F_X(∞) 이 1이므로, CDF의 정의를 생각한다면 당연한 귀결이 되겠고,
(b)와 (c)는 expected value의 정의를 사용하여 다음과 같이 증명해 볼 수 있다.

\begin{array}{rll} E[X] &=& \int_{-\infty}^{\infty} xf_X(x) ~dx\\ &=&\int_{0}^{\infty} xe^{-\lambda x} ~dx\\ &=&\left[-xe^{-\lambda x}\right]_{0}^{\infty} +\int_{0}^{\infty} e^{-\lambda x} ~dx\\ &=&(-1/\lambda) \left[ e^{-\lambda x} \right]_{0}^{\infty}\\ &=&1/\lambda  \end{array}


\begin{array}{rll} E[X^2] &=& \int_{-\infty}^{\infty} x^2f_X(x) ~dx\\ &=&\int_{0}^{\infty} x^2e^{-\lambda x} ~dx\\ &=&\left[-x^2e^{-\lambda x}\right]_{0}^{\infty} +\int_{0}^{\infty} 2xe^{-\lambda x} ~dx\\ &=&2/\lambda^2\\\\ Var[X] &= & E[X^2] - E[X]^2\\ &=&2/\lambda^2 - (1/\lambda)^2\\ &=&1/\lambda^2 \end{array}


Uniform (a, b) RV 에서 discrete RV인 discrete uniform (a+1, b) RV로 바꿀 수 있었던 것과 같이
exponential (λ) RV 역시 geometric (p) RV로 바꿀 수 있다.
어떤 X가 exponential (λ) RV 일때,


위와 같은 K가 있으면 이 K는 p = 1 - e^(-λ)geometric (p) RV가 된다.
증명은 간단한 수식을 통해 할 수 있다.

\begin {array}{rll}  P[K=k]&=&P_K(k)=\int_{k-1}^{k} P_X(x)dx \\ &=&F_X(k) - F_X(k-1)\\ &=&(1-e^{-\lambda k}) -(1-e^{-\lambda (k-1)}) \\ &=&(1-e^{-\lambda})(e^{-\lambda })^{k-1}\\ &=&p(1-p)^{k-1} ~~~~~~(let~p=1-e^{-\lambda}, ~1-p = e^{-\lambda})\\ \end{array}




Erlang Random Variable

f_X(x)=\begin{cases} \frac{\lambda^n x^{n-1} e^{-\lambda x}}{(n-1)!} & x \ge 0 \\ 0 & otherwise \end{cases}, ~~~~~where~\lambda >0 ~and~n\ge 1


위와 같은 PDF를 가진 continuous RV를 Erlang (n, λ) RV 라고 한다.
여기서 n은 Erlang RV의 order 라고 하며, Erlang (1, λ) RV는 곧 exponential (λ) RV와 같다.
Exponential RV와 geometric RV가 밀접한 관계를 갖는 것 처럼
Erlang RV와 Pascal RV도 그와 같은 관계를 갖고 있다. 여기서는 변환 과정에 대해서 설명하지는 않겠다.

Erlang RV는 어떤 때에 모델링 되는가에 대한 의문이 자연스레 떠오르는데,
우리가 이전에 Poisson RV에 대해 다뤘을 때 설명했던 바와 같이, 
포아송 분포는 시간과 사건의 발생횟수의 평균에 관한 정보를 알고 있을 때,
특정 시간동안 사건이 몇 번 발생할 것인가에 대한 확률 정보를 나타낸다.

이러한 사건이 n회 발생할때,
n회의 사건 사이에 사건이 일어나지 않는 시간을 보통 Erlang RV를 이용해 나타낸다.

한편 Erlang RV에 대해 다음이 성립한다.

\begin{array}{rl}(a)&F_X(x)=1-F_{K_{\lambda x}} (n-1) =1- \sum_{k=0}^{n-1} \frac{(\lambda x)^k e^{-\lambda x}}{k!}\\(b)&E[X]=n/\lambda \\(c)&Var[X]=n/\lambda^2 \end{array}


(a)의 경우 K_α가 Poisson (α) RV 이고, x > 0 일때, Erlang (n, λ) RV의 CDF를 나타내고 있다.
(b)와 (c)를 보면, Erlang RV와 exponential RV의 expected value와 variance가 연관됨을 볼 수 있다.