✨컴공주✨ [1052682] · MS 2021 (수정됨) · 쪽지

2025-01-21 22:27:39
조회수 278

컴공 일기266

게시글 주소: https://i9.orbi.kr/00071460551


n이 충분히 크고 적당한 λ가 존재해서 np = λ 라면, 이항분포 B(n,p)를 포아송 분포 POI(λ)로 근사시킬 수 있습니다.


사실 이항분포는 개별 시행마다 성공 확률과 실패 확률을 세세하게 따지기 때문에, 확률을 계산함에 있어서 복잡합니다.

특히 n값이 커지면 커질수록 그렇지요.


포아송 분포의 장점은, 이항분포처럼 개별 시행마다의 확률을 따지지 않고, 단위시간 / 구간 당 평균적으로 몇 번을 성공했는지만 따져도 적확한 확률을 구할 수 있다는 것에 있습니다. 또한, 이항 분포는 시행횟수 n과 확률 p를 매번 조정하면서 확률을 계산해야 하지만, 포아송 분포의 경우는 모수(λ)를 적절하게만 변환시켜 주어도 단번에 값을 구할 수 있죠.


예를 들어, 어떤 일을 독립시행한 횟수가 100번이고 어떤 일이 일어날 확률 P = 0.01이라고 가정합시다.

또 그 일이 2번 성공할 확률을 구한다고 가정해보죠.


그러면 X~B(100, 0.01)이고 시행은 독립적이므로 100C2 * (0.01)^2 * (0.99)^98

이 됩니다. 확률을 구하기는 했지만, 이 값이 대략적으로 얼마 즈음인지 단번에 파악하기가 쉽지 않죠.


하지만 시행횟수가 충분히 크므로 포아송 분포를 적용할 수 있는데, 이런 경우 조금 더 쉽게 구할 수 있습니다.


POI(λ) = x! / e^-λ * (λ)^x (x : 성공한 횟수, λ : 모수) 


여기서 λ = np = 100 * 0.01 = 1

POI(1) = 2! / e^-1 


e^-1 ~= 0.3679 정도 되므로 확률이 대략 0.1839 정도라는 사실을 알 수 있습니다.


포아송 분포의 확률질량함수식이 비교적 이항분포 확률질량함수식보다 계산하기 용이하다는 장점도 있지만,

이 분포의 가장 큰 강점은 유연성에 있습니다. λ를 자유롭게 잡을 수 있거든요. 하루 평균, 일주일 평균,

1년 평균… 원하는 값을 조정해 줄 수 있기 때문에 개별 시행에 집착하는 이항 분포보다는 조금 더 현실적인

분포라고도 볼 수 있겠습니다.



0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.


  • 첫번째 댓글의 주인공이 되어보세요.