Poisson Distribution이란?
아주 가끔 일어나는 사건(trial)에 대한 확률 분포 : 방사선 검출에 주로 사용되는 확률분포라 의료영상에서는 매우 많이 사용됨.
- 전체 인구수에서 연간 백혈병으로 사망 건수
- 특정 지역에서 발생하는 살인사건 건수나 군대의 연간 사망건수
Poisson distribution에서 평균 발생 건수(mean)가 $\lambda$인 경우에 $x$번 발생할 확률은 다음과 같음.
(Poisson distribution의 PMF)
$$ \text{Poisson}(x;\lambda)=\frac{\lambda^x e^{-\lambda}}{x!} $$
- 이는 binomial distribution에서 $N$을 무한대로 보내고, mean이었던 $\mu=Np=\lambda$로 치환하여 얻어짐.
- 일반적으로 $N \ge 10$, 성공확률 $p\le 0.1$인 binomial distribution인 경우 Poisson distribution과 유사함.
- 즉, 발생확률 $p$가 매우 낮은 경우면서 시행횟수 $N$이 무한대인 binomial distribution임.
- Poisson 분포에서 $\lambda$가 충분히 커지면 확률분포가 Normal distribution과 같아짐.
적용조건 (= Poisson process를 따를 조건, Poisson trial의 조건):
💡 Poisson Probability Distribution을 보이는 경우 (Poisson process)의 조건.
- 각각의 단위 시간 (~각 단위시간은 중첩되지 않음) 동안 사건 발생 수는 서로 independent(독립)
- 극히 작은 기간(~ 충분히 짧은 기간)에 둘 이상의 사건이 발생(~ 동시에 2건 이상의 사건이 발생)할 확률은 0으로 간주.
- 예를 들어 10분에 평균 10건의 신고가 접수된다면,
- 1초 동안 2건 이상의 신고가 접수될 확률은 0으로 간주할 수 있음.
- 단위 시간은 더 작은 단위 시간들로 나누어질 수 있으며, 이 경우 작은 단위 시간에서 사건이 발생할 확률은 더 작아짐: 발생 확률은 해당 단위 시간의 구간 길이에 비례함.
- 어떤 단위시간에 사건 발생 확률이 $p$이라면, 기간 $t$동안 평균 발생 건수는 $\lambda =pt$임. ← 발생확률이 시간에 비례!!
- $p$가 매우 낮고, 기간 $t$동안 사건 발생 횟수가 독립적이고, 해당 발생확률이 시간에 비례하면 Poissson분포를 따름.
- 이 경우, 해당 사건이 $t$동안 사건이 $x$번 발생할 확률은
- $$ P[X(t)=x]=\dfrac{(\lambda t)^x}{x!}e^{-\lambda t}, x=0,1,2,\dots $$
Derivation (← Poisson Limit Theorem)
binomial distribution에서 유도됨
$$\begin{aligned} \text{Bin}(x;N,\mu) &= \left(\begin{matrix}N \\ x \end{matrix} \right) \mu^x(1-\mu)^{N-x}\\ &=\dfrac{N!}{x!(N-x)!}\mu^x(1-\mu)^{N-x} \end{aligned}$$
Binomial distribution에서
- $N$을 무한대로 (무수히 많이 실행),
- $\mu$를 무한소로 (매우 낮은 확률) 보내고,
- $N\mu=\lambda$ 라고 할 경우,
Poisson distribution이 됨.
$$ \lim_{N-\infty}\frac{N!}{x!(N-x)!}\mu^x(1-\mu)^{N-x} $$
우선, $N$의 trial에서 $\lambda$번 성공한다고 하면 $\mu=\frac{\lambda}{N}$이 됨.
$$ \begin{aligned}\lim_{N-\infty}\frac{N!}{x!(N-x)!}\mu^x(1-\mu)^{N-x}&=\lim_{N-\infty}\frac{N!}{x!(N-x)!}\left(\frac{\lambda}{N}\right)^x\left(1-\frac{\lambda}{N}\right)^{N-x}\\&=\lim_{N-\infty}\frac{N!}{x!(N-x)!}\left(\frac{\lambda}{N}\right)^x\frac{\left(1-\frac{\lambda}{N}\right)^N}{\left(1-\frac{\lambda}{N}\right)^x}\\&=\lim_{N-\infty}\frac{N(N-1)(N-2)\cdots1}{x!(N-x)(N-x-1)\cdots1}\left(\frac{\lambda}{N}\right)^x\frac{\left(1-\frac{\lambda}{N}\right)^N}{\left(1-\frac{\lambda}{N}\right)^x}\\&=\lim_{N-\infty}\frac{(N-0)(N-1)(N-2)\cdots(N-(N-1))}{x!(N-x-0)(N-x-1)\cdots(N-x-(N-x-1))}\left(\frac{\lambda}{N}\right)^x\frac{\left(1-\frac{\lambda}{N}\right)^N}{\left(1-\frac{\lambda}{N}\right)^x}\\&=\lim_{N-\infty}\frac{N^N}{x!N^{(N-x)}}\left(\frac{\lambda}{N}\right)^x\frac{\left(1-\frac{\lambda}{N}\right)^N}{\left(1-\frac{\lambda}{N}\right)^x}\\&=\lim_{N-\infty}\frac{1}{x!}N^{x}\left(\frac{\lambda^x}{N^x}\right)\frac{\left(1-\frac{\lambda}{N}\right)^N}{\left(1-\frac{\lambda}{N}\right)^x}\\&=\lim_{N-\infty}\frac{1}{x!}\left(\frac{\lambda^x}{1}\right)\frac{\left(1-\frac{\lambda}{N}\right)^N}{\left(1-0\right)^x}\\&=\frac{1}{x!}\left(\frac{\lambda^x}{1}\right)\frac{e^{-\lambda}}{1}\\&=\frac{\lambda^xe^{-\lambda}}{x!}\end{aligned} $$
위의 유도에서 $\displaystyle\lim_{N \to \infty}\left(1-\frac{\lambda}{N}\right)^N=e^{-\lambda}$
이에 대한 상세한 유도는 다음을 참고
2023.10.25 - [.../Math] - [Math] Euler’s Constant (자연상수, 오일러 상수)
특성
- 분포의 특성상, positive영역에만 존재함.
- Poisson distribution에서 mean과 variance는 같음.
Moments
Expected Value (=mean)
- $\lambda$
Variance
- $\lambda$
Sum of two independent Poisson variables
💡 Poisson분포를 따르는 두 개의 독립된 random variable의 합도 Poisson 분포임.
$X \sim P(\lambda)$ and $Y\sim P(\mu)$ meaning that $X$ and $Y$ are Poisson distributions.
What is the probability distribution law of $X+Y$.
Answer : $X+Y \sim P(\lambda+\mu)$
- 단, 곱은 poisson이 아님. 단, 독립일 경우 평균은 서로의 평균을 곱한 값임.
증명
$$ \begin{aligned} P(X+ Y =k) &= \sum_{i = 0}^k P(X+ Y = k, X = i)\\ &= \sum_{i=0}^k P(Y = k-i , X =i)\\ &= \sum_{i=0}^k P(Y = k-i)P(X=i)\\ &= \sum_{i=0}^k e^{-\mu}\frac{\mu^{k-i}}{(k-i)!}e^{-\lambda}\frac{\lambda^i}{i!}\\ &= e^{-(\mu + \lambda)}\frac 1{k!}\sum_{i=0}^k \frac{k!}{i!(k-i)!}\mu^{k-i}\lambda^i\\ &= e^{-(\mu + \lambda)}\frac 1{k!}\sum_{i=0}^k \binom ki\mu^{k-i}\lambda^i\\ &= \frac{(\mu + \lambda)^k}{k!} \cdot e^{-(\mu + \lambda)} \end{aligned} $$
'... > Math' 카테고리의 다른 글
[Math] Normal Distribution (정규분포) (2) | 2023.10.25 |
---|---|
[Math] Euler’s Constant (자연상수, 오일러 상수) (0) | 2023.10.25 |
[Math] Derivative of Logistic Function (0) | 2023.09.25 |
[Math] Error Function (0) | 2023.09.24 |
[Math] The Cauchy-Schwarz Inequality (0) | 2023.08.22 |