Probability Distribution
Probability Distribution은 특정 random variable(확률 변수)이 취할 수 있는 각각의 값에 대한 확률을 나타내는 분포임.
- Probability Distribution Function으로 기술되며,
- random variable이 어떤 값을 얼마나 자주 취하는지를 나타냄.
- 이를 통해 random variable의 특성과 동작을 이해할 수 있음.
Definition of PDF
random variable $X$가 가질 수 있는 특정한 value $x$와 이 $x$에 대응하는 확률을 매핑하고 있는 function.
- PDF는 abbreviation of Probability Distribution Function.
- pdf는 probability density function.
$$
P_X(C)=Pr[X\le C]
$$
- $Pr[X \le C]$ : 확률변수 $X$가 $C$보다 같거나 작은 값을 가질 확률.
이 PDF는 다음의 성질을 가짐.
- $0\le P_X(C)\le 1$
- $P_X(-\infty)=0$
- $P_X(\infty)=1$
- $P_X(C_1) \le P_X(C_2)$, for $C_1 \le C_2$
다른 이름으로는
cumulative distribution function (cdf)라고도 불림.
다음과 같이 뒤에 다루는 pmf
또는 pdf
의 적분 형태로 기재할 수 있음.
- $\text{cdf}(c)=\displaystyle \sum_{x\le c} \text{pmf}(x)$
- $\text{cdf}(c)=\displaystyle \int_{-\infty}^c \text{pdf}(x) dx$
Exampe of PDF
두 개의 동전을 던졌을 때, 앞면이 나오는 횟수를 random variable X라고 할 경우, probability distribution은 다음과 같음.
$X$ | $p(X=x)$ | $PDF(X=x)$ |
0 | 1/4 | 1/4 |
1 | 1/2 | 3/4 |
2 | 1/4 | 4/4=1 |
pdf and pmf
probability mass function (확률질량함수, pmf)
- discrete random variable (취할 수 있는 값이 유한하거나 셀수 있음) 의 probability distribution (확률분포)를 기재.
- $f(x)=\left\{\begin{matrix}p(X=x_i) & x=x_i (i=1,2,\dots,k) \\ 0 & \text{others} \end{matrix}\right.$
- 모든 $X$에 대해 $f(x)\ge0$
- $\displaystyle \sum_S f(x)=1$
- $S$ : sample space : $x\in S$
probability density function (확률밀도함수, pdf)
- continuous random variable (취할 수 있는 값이 연속적으로 셀 수 없음=무한개) 의 probability distribution (확률분포)를 기재.
- 확률변수 $X$와 확률밀도의 관계를 나타내는 함수.
- 특정값에 대한 pdf의 값은 0임. (구간으로 입력해야 값을 가짐) : $\int_c^cf(x)dx=0$
- 특정 구간에 대한 적분값은 0이상.
- 확률변수 $X$가 두 수 $x_1$와 $x_2$ 사이에 놓일 확률은 pdf $f(x)$의 아래 $x_1$과 $x_2$ 사이의 면적과 같다.
- $p(x_1 \le X \le x_2) = \displaystyle \int_{x_1}^{x_2} f(x)dx$
- 전체 면적은 1.
- $\underset{S}{\int} f(x) dx = 1$
- $S$ : sample space : $x\in S$
같이 보면 좋은 자료들
2024.05.02 - [분류 전체보기] - [Math] Example: pmf, pdf, and cdf
[Math] Example: pmf, pdf, and cdf
27) Probability Mass Function (pmf)은 어떤 종류의 데이터에 사용됩니까? A) 연속 데이터 B) 이산 데이터 C) 양의 데이터 D) 음의 데이터 Ans. B) pmf는 discrete random variable에 대해 정의됨.28) Probability Density Funct
dsaint31.tistory.com
2023.03.09 - [.../Math] - [Math] Random Variable
[Math] Random Variable
Random Variable Random variable(확률변수)란 sample space의 event (=subset of sample space)들을 어떤 real number(실수)나 integer(정수) 등의 숫자들에 mapping한 것을 가르킨다. "Random process 나 Random trial (or Random experiment)
dsaint31.tistory.com
2024.04.17 - [.../Math] - [Math] Probability 란
[Math] Probability 란
Probability란? 어떠한 event(사건, 사상)의 공간(=sample space, 발생가능한 모든 sample로 구성된 set)에서 특정 event(or sample의 set)가 선택될(발생할) 수 있는 불확실성(uncertainity)을 수치적으로 나타낸 것.
dsaint31.tistory.com
2024.02.23 - [.../Math] - [Math] Random이란?
[Math] Random이란?
Random은 주로 non-determinstic인 패턴 또는 순서 없이 결과가 발생하는 것을 의미하는 경우가 많다. Deterministc인 경우, function (or differential equation) 등을 이용한 모델링을 통해, inputs 에 대한 결과(output)
dsaint31.tistory.com
'... > Math' 카테고리의 다른 글
[Math] Categorical Distribution (0) | 2024.05.22 |
---|---|
[Math] Multinomial Distribution (다항분포) (0) | 2024.05.22 |
[Math] 확률에서 Partition: Mutually Exclusive and Exhaustive (0) | 2024.04.18 |
[Math] 확률의 법칙들 (0) | 2024.04.18 |
[Math] Conditional Probability and Joint Probability (0) | 2024.04.17 |