[Probability] Independent Trials
2012. 2. 3. 02:57
Independent Trials
이전 포스트에서 다루었던 independence와는 약간 다른 개념인데,
그냥 이미 익히 들어서 알고 있는 '독립시행'이 여기서 다루고자 하는 것이다.
즉, 같은 주사위를 몇번이고 던진다든지 하는 것들이 그것이다.
바로 전 포스트에서 sample space의 크기를 측정했다면,
여기서는 그것 보다는 확률의 수치를 가지고 노는 것이라고 생각하면 되겠다.
여기서 다룰 내용은 이후에 다루게 될 내용에도 다시한번 언급이 될 것이다.
Success & Failure Model
어떤 experiment를 수행했을때, 특정 event가 발생할 확률이 p라고 하자.
이것을 n (= n_0 + n_1)번 반복했을 때, n_1번 성공하고 n_0번 실패할 확률은 다음과 같이 구할 수 있다.
예를 들어 당신이 누군가와 체스를 뒀을 때, 이길 확률이 70%라고 한다면,
승패에 관계없이 5번의 경기를 해서 3번을 이기기 위해서는 승승승패패, 승승패승패... 와 같은 방법이 가능하다.
즉 3번의 승리와 2번의 패배를 어느 시점에 할 것인가, 다시 말해 승패를 어떤 순서로 배열할까에 관한 문제가 된다.
각 식의 맨 앞에 나오는 combination은 그것을 나타내고 있다.
엄밀히 이야기하면 여기서 나오는 combination은 일반적인 의미의 combination이라기 보다는,
multinomial coefficient이라고 생각하는 것이 맞지만,
어쨌든 결과적으로 어떤 방법을 사용하든 동일한 결과가 나오므로,
표기가 좀 더 간단한 combination의 형태를 쓰고 있다.
뒤이어 나오는 식은 확률을 계산해 준 것이다. 여기서의 예라면 3번 이기고 2번 지는 확률을 나타내게 된다.
여기서 조금 더 어려운 문제는 5판 3선승제와 같은 것을 생각해 볼 수 있다.
즉 3번을 내리 이긴다든가 져 버리는 등, 5번의 승부를 모두 펼치기 이전에 이미 전체 게임이 끝나는 경우가 생겨,
이런 exception에 대한 처리를 해줘야 하기 때문이다.
결론적으로는 위와 같은 공식을 사용하기 곤란해지므로 조금 더 섬세한 계산이 필요하게 된다.
General Model
어떤 subexperiment가 다음과 같은 sample space S를 가지고,
n번의 independent trial이 다음과 같이 정의된다고 했을때,
s_i가 n_i번 등장할 확률은 다음과 같이 계산할 수 있다.
이것이 조금 더 일반적인 경우에 대한 모델이다.
이전에 다뤘던 multinomial coefficient의 형태가 다시 보이고 있다.
이미 앞서 언급했던바와 같이, 중복되는 원소들을 어떻게 조합할 것인가의 문제이다.
다만 여기서는 확률이 추가된 것 뿐이다.
만약 앞선 문제에서 이기고 지는것 뿐 아니라 비기는 경우를 추가한다고 하자.
이길 확률 70%, 비길 확률 10%, 질 확률 20%라면,
단순히 success & failure model만 가지고는 확률 계산이 힘들다. (불가능한것은 아니다.)
Success & failure model은 general model 중에 특별한 case라고 할 수 있다.
Reliability
Success and failure model을 좀더 확장시켜보면 각각의 independent trial 간에는 위와 같은 관계들이 가능하다.
W_1, W_2... 는 각각의 trial을 나타내고 있다.
'Components in series'의 경우는 각각의 trial이 연속적으로 이루어지는 것을 말한다.
이 경우에는 3가지 중 하나라도 실패해서는 안된다. 다시 말해서 3가지 모두 성공해야 전체적으로 성공이다.
한편 'Components in parallel'의 경우는 각각의 trial중 어느하나라도 성공하면 된다.
'Complex form'의 경우는 두 가지 경우가 결합된 형태로 나타난다.
각각의 경우에 대해서 우리는 어떻게 확률을 계산할 것인가에 대한 문제에 직면하게 된다.
간단한 예제를 들기 위해서 각각의 trial은 p라는 확률로 성공하고 (1-p)확률로 실패한다고 하자.
Series form이 전체적으로 성공하려면 각각의 확률을 그냥 곱해주면 된다.
Parallel form은 이에 비해서는 조금 더 복잡한 편이다.
예제에서 전체적인 experiment가 실패하기 위해서는 n가지의 trial이 모두 실패해야 한다.
그 이외의 모든 경우에서는 성공이므로, 이것을 이용하면 된다.
실패확률은 (1-p)이므로 n가지가 모두 실패할 확률은 (1-p)^n이다.
따라서 성공할 확률은 1에서 이를 빼주면 된다. 즉, 최종적으로 1-(1-p)^n 이 된다.
Complex form에 대해서도 이러한 맥락으로 이해하면 된다.
예제를 보면 위 아래로 2개의 trial이 series로 이어져 있고, 다시 두개의 series가 parallel 하게 이어져 있다.
우리는 각각의 series를 하나로 뭉쳐서 볼 수 있다. 두 series는 각각 p^2 의 성공률을 가진다.
전체적으로 모두 실패하려면 두 series가 모두 실패로 돌아가야 한다. 즉 (1-p^2)^2가 된다.
마찬가지로, 전체적으로 성공할 확률은 1-(1-p^2)^2 가 된다.
여러가지의 trial이라든지 혹은 subexperiment가 섞여있는 경우 이런 방식으로 계산하면 된다.