[Pairs of RV] Functions of Two Random Variables
2012. 2. 24. 23:47
개요
두 개의 random variable을 조합하여 우리가 필요한 어떤 다른 정보를 얻을 수 있는,
새로운 random variable을 W = g(X,Y) 와 같이 얻을 수 있다.
X, Y에 대한 joint PMF나 joint PDF가 이미 있다면, 우리가 생각해 보아야 할 문제는
W에 대한 probability model을 이 joint PMF와 joint PDF에서 어떻게 이끌어 낼것인가 하는 것이다.
Case I: Discrete RV
먼저 discrete RV인 X, Y에 대해서,
새롭게 얻고자 하는 random variable W의 sample space는 곧 g(X,Y)의 모든 가능한 value가 될 것이다.
그러면 W의 PMF는 X,Y의 joint PMF와 다음과 같은 관계를 갖는다.
여기서 밑의 (x,y):g(x,y)=w는 g(x,y)=w를 만족하는 (x,y)의 합을 말하는 것이다.
즉, g(X,Y) = w를 만족하는 outcome의 합이 곧 어떤 outcome w의 확률값과 같다.
예제를 통해 실제 적용을 해보자.
어떤 회사에서 팩스를 보내는데,
팩스의 각 페이지를 보내는데 걸리는 시간에 대한 RV T와,
팩스의 페이지수에 대한 RV L이 아래와 같이 조사되었다.
이때 D = g(L,T) = LT 를 팩스를 보내는데 걸리는 총 시간이라고 할 때,
D의 sample space와 PMF 그리고 E[D]를 구하라. 먼저, 가능한 D의 값들은
각각의 outcome에 대해서 probability를 구해보면,
Expected value를 구하는 것은 기존의 discrete RV의 expected value를 구하는 방법을 그대로 사용하면 된다.
Case II: Continuous RV
Continuous RV에 대해서는 먼저 CDF를 구하는 것이 편한 접근법이 될 수있다.
그 다음에는 CDF의 derivative를 통해서 PDF를 구하면 된다.
물론 많은 g(x,y)에 대해서 이 작업은 상당히 지루한 것일 수 있다.
다만 특별한 몇몇 종류의 g(x,y)에 대해서 편리한 방법이 존재하며, 이는 이후에 설명해 나갈 예정이다.
마찬가지로 예제를 살펴보자.
X, Y가 다음의 joint PDF를 가질 때, W = Y/X의 PDF를 구하라.
먼저 CDF를 구하면,
양변에 derivative를 취하면,
을 얻는다.
Case III: W = max(X, Y)
Continuous RV X, Y에 대해서 W = max(X, Y)의 CDF는 다음과 같이 구할 수 있다.
X와 Y의 최대값을 구하는 것은 결국 X와 Y에서 w이하의 모든 범위 중에서 가장 큰 값을 찾아야 하는 것과 같다.
즉, 범위의 설정은 {W ≤ w} = {X ≤ w} ∩ {Y ≤ w}과 같다.
간단하게 생각할 수 있지만, 여기서도 PDF의 모양을 잘 살펴보아야 한다.
X와 Y의 joint PDF가 다음과 같이 정의 될 때 W = max(X, Y)의 PDF를 구하라.
먼저 X 와 Y가 0 이상이므로 W 역시 0 이상이 될 수 밖에 없다.
X는 5까지, Y는 3까지의 값을 가지므로, W의 범위는 0 ~ 5까지이다.
하지만, 세부적으로는 두 가지의 case로 나누어 생각해야 한다.
w는 양쪽으로 확장이 되는데, PDF의 X, Y의 범위는 불균형하게 되어있기 때문에,
w가 3에 도달하는 순간부터 case를 나누어 생각해야 하는 것이다.
먼저 0~3의 범위에서는,
PDF가 모든 범위에서 constant하기 때문에, 결국 넓이를 15로 나눈 값이다.
한편 3~5의 범위에서는 y의 높이가 3으로 고정되므로, 식을 쓰면,
와 같다. 이제 최종적으로 CDF를 정리해 보면,
이제 양변에 derivative를 취하여 PDF를 구하면,
와 같다.