메뉴
[Pairs of RV] Functions of Two Random Variables

2012. 2. 24. 23:47

개요

두 개의 random variable을 조합하여 우리가 필요한 어떤 다른 정보를 얻을 수 있는,
새로운 random variable을 W = g(X,Y) 와 같이 얻을 수 있다.
X, Y에 대한 joint PMF나 joint PDF가 이미 있다면, 우리가 생각해 보아야 할 문제는
W에 대한 probability model을 이 joint PMF와 joint PDF에서 어떻게 이끌어 낼것인가 하는 것이다.




Case I: Discrete RV

먼저 discrete RV인 X, Y에 대해서,
새롭게 얻고자 하는 random variable W의 sample space는 곧 g(X,Y)의 모든 가능한 value가 될 것이다.
그러면 W의 PMF는 X,Y의 joint PMF와 다음과 같은 관계를 갖는다.

P_W(w) = \sum_{(x,y):g(x,y)=w} P_{X,Y}(x,y)


여기서 밑의 (x,y):g(x,y)=w는 g(x,y)=w를 만족하는 (x,y)의 합을 말하는 것이다.
즉, g(X,Y) = w를 만족하는 outcome의 합이 곧 어떤 outcome w의 확률값과 같다.
예제를 통해 실제 적용을 해보자.



어떤 회사에서 팩스를 보내는데,
팩스의 각 페이지를 보내는데 걸리는 시간에 대한 RV T와,
팩스의 페이지수에 대한 RV L이 아래와 같이 조사되었다.


이때 D = g(L,T) = LT 를 팩스를 보내는데 걸리는 총 시간이라고 할 때,
D의 sample space와 PMF 그리고 E[D]를 구하라.

먼저, 가능한 D의 값들은

S_D=\{40,60,80,120,180\}


각각의 outcome에 대해서 probability를 구해보면,

P_D(d)=\begin{cases} P_{L,T}(1,40) = 0.15 & d=40 \\ P_{L,T}(1,60) = 0.1 & d=60 \\ P_{L,T}(2,40) = 0.3 & d=80 \\ P_{L,T}(3,40) + P_{L,T}(2,60) = 0.35 & d=120 \\ P_{L,T}(3,60) = 0.1 & d=180 \\ 0 & otherwise\\  \end{cases}


Expected value를 구하는 것은 기존의 discrete RV의 expected value를 구하는 방법을 그대로 사용하면 된다.

\begin{array}{rll}E[D] &=& \sum_{d \in S_D}d P_D(d)\\&=& 40 \cdot 0.15 +60 \cdot 0.1 +80 \cdot 0.3 +120 \cdot 0.35 +180 \cdot 0.1\\&=& 96\end{array}




Case II: Continuous RV

F_W(w) = P[W\leq w]=\iint_{g(x,y) \leq w}f_{X,Y}(x,y) ~dx~dy


Continuous RV에 대해서는 먼저 CDF를 구하는 것이 편한 접근법이 될 수있다.
그 다음에는 CDF의 derivative를 통해서 PDF를 구하면 된다.
물론 많은 g(x,y)에 대해서 이 작업은 상당히 지루한 것일 수 있다.
다만 특별한 몇몇 종류의 g(x,y)에 대해서 편리한 방법이 존재하며, 이는 이후에 설명해 나갈 예정이다.
마찬가지로 예제를 살펴보자.



X, Y가 다음의 joint PDF를 가질 때, W = Y/X의 PDF를 구하라.

f_{X,Y}(x,y) = \begin {cases} \lambda \mu e^{-(\lambda x + \mu y)} & x\ge 0, y\ge 0\\ 0& otherwise \end{cases}


 먼저 CDF를 구하면, 

\begin {array}{rll}F_W(w) &=& P[Y/X\leq w] \\&=& P[Y \leq wX]\\&=&\int_0^\infty \left( \int_{0}^{wx}f_{X,Y}(x,y) ~dy  \right)dx \\ &=&\int_0^\infty \lambda e^{-\lambda x} \left( \int_{0}^{wx}\mu e^{-\mu y} ~dy  \right)dx\\ &=& \int_0^\infty \lambda e^{-\lambda x} \left( 1-e^{-\mu wx}  \right)dx\\ &=& 1- \frac{\lambda}{\lambda + \mu w}\\\\ F_W(w) &=& \begin {cases} 0 & w<0\\ 1- \frac{\lambda}{\lambda + \mu w} & w\ge 0\end{cases} \end{array}


양변에 derivative를 취하면,

f_W(w)= \begin {cases} \frac{\lambda \mu}{(\lambda + \mu w)^2} & w \ge 0 \\ 0 & otherwise \end{cases}


을 얻는다.



Case III: W = max(X, Y)

Continuous RV X, Y에 대해서 W = max(X, Y)의 CDF는 다음과 같이 구할 수 있다.

F_W(w)=F_{X,Y}(x,y)=\int_{-\infty}^w \int_{-\infty}^w f_{X,Y} (x,y) ~dx~dy


X와 Y의 최대값을 구하는 것은 결국 X와 Y에서 w이하의 모든 범위 중에서 가장 큰 값을 찾아야 하는 것과 같다.
즉, 범위의 설정은 {W ≤ w} = {X ≤ w} ∩ {Y ≤ w}과 같다. 
간단하게 생각할 수 있지만, 여기서도 PDF의 모양을 잘 살펴보아야 한다.



X와 Y의 joint PDF가 다음과 같이 정의 될 때 W = max(X, Y)의 PDF를 구하라.

f_{X,Y}(x,y)=\begin{cases} 1/15 & 0 \leq x \leq 5,~0\leq y \leq3 \\ 0 & otherwise \end{cases}


먼저 X 와 Y가 0 이상이므로 W 역시 0 이상이 될 수 밖에 없다.
X는 5까지, Y는 3까지의 값을 가지므로, W의 범위는 0 ~ 5까지이다.
하지만, 세부적으로는 두 가지의 case로 나누어 생각해야 한다.


w는 양쪽으로 확장이 되는데, PDF의 X, Y의 범위는 불균형하게 되어있기 때문에,
w가 3에 도달하는 순간부터 case를 나누어 생각해야 하는 것이다.
먼저 0~3의 범위에서는,

F_W(w) = \int_0^w \int_0^w  1/15 ~dx~dy = w^2/15


PDF가 모든 범위에서 constant하기 때문에, 결국 넓이를 15로 나눈 값이다.
한편 3~5의 범위에서는 y의 높이가 3으로 고정되므로, 식을 쓰면,

F_W(w) = \int_0^w \int_0^3 1/15 ~dx~dy = w/5


와 같다. 이제 최종적으로 CDF를 정리해 보면,

F_W(w) = \begin{cases} 0 & w<0 \\ w^2/15 & 0\leq w \leq 3 \\ w/5 &3<w \leq 5 \\ 1 &w>5 \end{cases}


이제 양변에 derivative를 취하여 PDF를 구하면,

f_W(w) = \begin{cases} 2w/15 & 0\leq w \leq 3 \\ 1/5 &3<w \leq 5 \\ 0 & otherwise \end{cases}


와 같다.