Sampling Error (표본 오차, Sampling Noise)
정의: population 에서 sampling을 수행할 때 random(우연)에 의해 발생하는 무작위적 변동(random variability).
sampling에서 randomness를 피할수 없고 해당 sample에서 얻어진 sample statistics가 population statistics와 달라지는 error가 발생할 수 있으며 이는 sampling error(=random variability)에 기인함.
다른 이름:
- sampling variability
- sampling noise
(error는 잘못이라는 의미가 있는데 sampling error는 실수나 잘못으로 발생하지 않기 때문에 noise를 선호하는 이들도 많음)
특징:
- 같은 population에서 표본을 여러 번 뽑으면 표본 평균, 분산 등이 제각각 다르게 나옴.
- 단, sample size(표본 수)가 커질수록(큰 n):
- Central Limit Theorem (중심극한정리)에 의해 sample의 평균이 모집단의 참값에 수렴함
- 즉, sampling noise가 감소함.
- 무수히 많은 sampling에 의한 sampling distribution에서의 standard deviation이 sampling error의 크기에 해당함.
- 무작위성 때문에 피할 수 없으나 줄일 수는 있음:
- sample size가 크면 클수록 줄어듦.
sampling error의 예는 다음과 같음:
- 동전을 100번 던졌을 때 앞면이 53번 나온 경우,
- 모집단 확률은 0.5지만
- sample에서는 sampling error로 인해 0.53이 나옴.
다음 그림은 sample size에 따른 sample mean의 sampling distribution 과 sampling error 의 양을 보여줌:

많은 경우 sampling distribution의 standard error를 통해 sampling error의 크기를 추정 또는 정량화함.
Sampling error :
Variability of a statistic from sample to sample due to chance.
Standard error :
A standard error is just the standard deviation of the sampling distribution: $\text{SE}=\frac{\sigma}{\sqrt{n}}$ (이 식의 값에 100을 곱해 %단위로 나타내는 경우가 많음. $\sigma$는 population의 variance임.)
Sampling Bias (표본 편향)
정의: sampling 과정 자체가 체계적으로 왜곡되어 얻어진 sample이 population을 제대로 반영하지 못하는 현상.
특징:
- sample size를 늘려도 해결되지 않음.
- sampling bias의 원인은 sampling 방법 설계상의 문제인:
- 특정 집단이 과대표집되거나 소외되는 sampling 이 대표적인 예임.
- randomness가 원인이 아니라 잘못된 방법론에서 발생.
대표적 예는 다음과 같음:
- 전화 여론조사에서 집 전화 있는 사람만 조사 => 젊은 층 과소대표.
- 온라인 설문조사에서 적극적으로 응답하는 사람만 포함 => 극단적 의견이 과대표.
비교
- Sampling noise는 “우연히 생긴 변동(랜덤성)”이고, sample size를 늘리면 줄어듦.
- Sampling bias는 “추출 과정 자체의 잘못(체계적 오류)”이고, sample size를 늘려도 계속 남음.
같이보면 좋은 자료들
2022.03.31 - [.../Math] - [Statistics] Central Limit Theorem
[Statistics] Central Limit Theorem
Central Limit Theorem (중심극한정리)mean의 sampling distribution의 다음과 같은 속성을 기술하는 Theorem이 Central Limit Theorem임.population이 무엇이든지 간에sample size ($N$, 1개의 sample의 element의 수)가 충분히 크
dsaint31.tistory.com
2024.02.23 - [.../Math] - [Math] Random Sampling
[Math] Random Sampling
Random SamplingRandom Sampling은 다음을 가르킴.Population(모집단)에서 element를 각각 무작위(random)로 선택하여 얻는sampling method(샘플링, 표본추출)을 가르킴. Statstics에서일반적으로 "제한된 수의 sample들로
dsaint31.tistory.com
2009.06.16 - [정리필요./방사선 계측] - Accuracy(정확도) vs. Precision(정밀도)
Accuracy(정확도) vs. Precision(정밀도)
이 두 용어의 차이를 정확히 알고 말하지 않는 경우가 생각보다 많다.사실 말하다보면 앞뒤 문맥으로 알 수는 있지만... 주의하자.Machine Learning의 classification에서의 accuracy와 precision은 조금 차이
dsaint31.tistory.com
'... > Math' 카테고리의 다른 글
| Independent Poisson variables의 합과 상수곱 (0) | 2025.10.14 |
|---|---|
| Error Propagation (or Delta Method) (0) | 2025.10.08 |
| Bayes' Theorem (Update Your Beliefs with Evidence) (0) | 2025.05.27 |
| [Summary] 확률 및 통계 기본 (0) | 2025.05.08 |
| [Math] Gamma Function (0) | 2025.04.29 |