메뉴
[Random Vector] Probability Models of N Random Variables

2012. 3. 7. 23:48

Multivariate Joint CDF

Random variable X_1, ..., X_n에 대한 joint CDF는 다음과 같이 정의한다.

F_{X_1,\cdots,X_n}(x_1,\cdots,x_n)=P[X_1\leq x_1,\cdots, X_n\leq x_n]

 
여기서의 X_1, ..., X_n은 continuous, discrete, mixed random variable에 모두 적용이 가능하다.
그러나 CDF 만으로는 probability model을 분석하기가 힘겨우므로,
multivariate PMF, PDF에 대한 정의를 덧붙여 살펴보도록 한다.



Multivariate Joint PMF

Random variable X_1, ..., X_n에 대한 joint PMF는 다음과 같이 정의한다.

P_{X_1,\cdots,X_n}(x_1,\cdots,x_n)=P[X_1 = x_1,\cdots, X_n = x_n]




Multivariate Joint PDF

Random variable X_1, ..., X_n에 대한 joint PDF는 다음과 같이 정의한다.

f_{X_1,\cdots,X_n}(x_1,\cdots,x_n)=\frac{\partial^n F_{X_1,\cdots,X_n}(x_1,\cdots,x_n)}{\partial_1 \cdots \partial_n}




Generalizations of the Axioms of Probability

Multivariate joint PMF, PDF에서도 axioms of probability의 일반화를 적용시켜볼 수 있다.

\begin{array}{rl} (a) & P_{X_1,\cdots,X_n}(x_1,\cdots,x_n)\ge 0 \\ (b) & \sum_{x_1\in S_{X_1}} \cdots \sum_{x_n\in S_{X_n}}  P_{X_1,\cdots,X_n}(x_1,\cdots,x_n) = 1 \\\\ (a) & f_{X_1,\cdots,X_n}(x_1,\cdots,x_n)\ge 0\\ (b) &F_{X_1,\cdots,X_n}(x_1,\cdots,x_n) = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_n}  f_{X_1,\cdots,X_n}(u_1,\cdots,u_n) ~du_1 \cdots du_n \\ (c) & \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty}  f_{X_1,\cdots,X_n}(x_1,\cdots,x_n) ~dx_1 \cdots dx_n = 1 \end{array}


한편 어떤 event A는 X_1, ..., X_n을 이용해 다음과 같이 표현한다. 

\left/X_1+X_2+\cdots+X_n\right/ \leq 1


다음과 같이 표현할 수도 있다.

max_i ~X_i \leq 100


한편, 어떤 event A의 확률은 다음과 같이 구한다.

\begin{array}{ll} Discrete: & P[A] = \sum_{(x_1,\cdots,x_n)\in A}P_{X_1,\cdots,X_n}(x_1,\cdots,x_n)\\ Continuous:& P[A] = \idotsint_A f_{X_1,\cdots,X_n}(x_1,\cdots,x_n) ~dx_1dx_2\cdots dx_n \end{array}


Discrete의 경우 1개의 summation을 쓴 것으로 볼 수 있으나, multiple sum을 해야하는 것은 변함없다.



예제

회사에 어떤 정보 요청이 들어오면 회사는 팩스로 답변해준다.
팩스의 길이는 1, 2, 3페이지 중 하나이며, 어떤 정보를 담고 있느냐에 따라 길이가 달라진다.
어떤 팩스의 길이를 나타내는 random variable L는 다음과 같은 PMF를 갖는다.

P_L(l) = \begin {cases}1/3& l=1 \\ 1/2 & l=2 \\ 1/6&l=3 \\ 0 & otherwise  \end{cases}


4개의 independent한 정보 요청에 대해 다음의 물음에 답하라.

(a) 1, 2, 3페이지 fax의 숫자를 나타내는 X, Y, Z에 대한 joint PMF를 찾아라.
팩스는 총 4번 나오게 되고, 각각은 위와 같은 PMF로 확률이 결정되어있으므로, 
X, Y, Z를 선택하는 경우의 수는 combination으로 구할 수 있고, multinomial PDF는 다음과 같이 쓸 수 있다.

P_{X,Y,Z}(x,y,z) = \begin{pmatrix} 4 \\ x,y,z \end{pmatrix} \left(\frac{1}{3}\right)^x \left(\frac{1}{2}\right)^y \left(\frac{1}{6}\right)^z


(b) 팩스의 길이가 8페이지가 되는 event를 A라고 할 때, P[A]는?
페이지의 길이가 8페이지가 되는 경우는 2페이지가 4번 전송되거나,
1페이지와 3페이지 각 하나에 2페이지 2개가 되거나, 1페이지와 3페이지 각 2개씩 전송되는 경우가 된다.
각 경우에 대해서 확률을 구해보면, 1/16, 1/6, 1/54 이므로, 모두 더하면 107/432가 된다.
따라서 P[A] = 107/432 이다.

(c) 4개 중 2개 이상의 팩스가 1페이지 보다 많을 event를 B라고 할 때, P[B]는? 
Event B를 만족한 경우의 수는 여러가지이므로, 그 역인 B^c에 대해 생각하는 방법을 쓴다.
1페이지 짜리가 3개 이상 발송될 경우를 모두 따져보면,
1페이지 3개 + 2페이지, 1페이지 3개 + 3페이지, 1페이지 4개의 3가지 경우가 있으며,
각각의 확률은 2/81, 2/27, 1/81이므로, 모두 더하면 1/9가 된다.
따라서 P[B] = 8/9 이다.