이산 확률 분포 중 하나인 푸아송 분포(Poisson Distribution)에 대해 알아보겠습니다.
푸아송 분포란 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 확률 분포입니다. 이항 분포 등의 다른 이산 확률 분포들과는 달리 실험의 전체 시도 횟수 중 실패 횟수를 알 필요가 없습니다.
즉, 일정한 시간과 공간에서 발생하는 사건의 발생횟수와 평균만 안다면 푸아송 분포를 구할 수 있습니다. 이 때 실험의 총 시험횟수는 필요 없습니다. 그래서 푸아송 분포에서는 일어나는 사건이 독립적이고 무작위적입니다.
제가 최근에 했던 프로젝트를 예로 들어보자면,
페이스북의 페이지에서 특정 키워드가 단위 시간(시간)동안 언급된 횟수(발생횟수)가 있겠습니다. (이 때 페이지는 미리 정해져 있습니다.)
이 외에도 어떤 공장(공간)에서 제작된 불량품 수(발생횟수) 등이 있습니다.
푸아송 분포의 공식은 다음과 같습니다.
여기서 e는 자연상수이고 λ는 람다라고 부르는 기호로 평균과 분산에 해당합니다.
▶참고 링크
https://ko.wikipedia.org/wiki/%ED%91%B8%EC%95%84%EC%86%A1_%EB%B6%84%ED%8F%AC
'확률과 통계' 카테고리의 다른 글
[통계] 공부할 때 참고할만한 사이트들 (0) | 2016.10.21 |
---|---|
[통계][머신러닝] 마할라노비스 거리(Mahalanobis Distance) (0) | 2016.08.11 |