sampling error vs. sampling bias

2025. 9. 16. 17:54·.../Math
728x90
728x90

Sampling Error (표본 오차, Sampling Noise)

정의: population 에서 sampling을 수행할 때 random(우연)에 의해 발생하는 무작위적 변동(random variability).

 

sampling에서 randomness를 피할수 없고 해당 sample에서 얻어진 sample statistics가 population statistics와 달라지는 error가 발생할 수 있으며 이는 sampling error(=random variability)에 기인함.

 

다른 이름:

  • sampling variability
  • sampling noise
    (error는 잘못이라는 의미가 있는데 sampling error는 실수나 잘못으로 발생하지 않기 때문에 noise를 선호하는 이들도 많음)

특징:

  • 같은 population에서 표본을 여러 번 뽑으면 표본 평균, 분산 등이 제각각 다르게 나옴.
  • 단, sample size(표본 수)가 커질수록(큰 n):
    • Central Limit Theorem (중심극한정리)에 의해 sample의 평균이 모집단의 참값에 수렴함
    • 즉, sampling noise가 감소함.
    • 무수히 많은 sampling에 의한 sampling distribution에서의 standard deviation이 sampling error의 크기에 해당함.
  • 무작위성 때문에 피할 수 없으나 줄일 수는 있음:
    • sample size가 크면 클수록 줄어듦.

sampling error의 예는 다음과 같음:

  • 동전을 100번 던졌을 때 앞면이 53번 나온 경우,
  • 모집단 확률은 0.5지만
  • sample에서는 sampling error로 인해 0.53이 나옴.

다음 그림은 sample size에 따른 sample mean의 sampling distribution 과 sampling error 의 양을 보여줌: 

margin of error(오차한계)는, 신뢰수준에 따른 임계값 z (95%신뢰도에서 약 1.96) 와 standard error를 곱한 값으로 population 의 parameter와 sample에서의 statistic이 차이가 나는지를 나타냄: $M=z\times\frac{\sigma}{\sqrt{n}}$

 

많은 경우 sampling distribution의 standard error를 통해 sampling error의 크기를 추정 또는 정량화함.

Sampling error :
Variability of a statistic from sample to sample due to chance.


Standard error :

A standard error is just the standard deviation of the sampling distribution: $\text{SE}=\frac{\sigma}{\sqrt{n}}$ (이 식의 값에 100을 곱해 %단위로 나타내는 경우가 많음. $\sigma$는 population의 variance임.)


Sampling Bias (표본 편향)

정의: sampling 과정 자체가 체계적으로 왜곡되어 얻어진 sample이 population을 제대로 반영하지 못하는 현상.

특징:

  • sample size를 늘려도 해결되지 않음.
  • sampling bias의 원인은 sampling 방법 설계상의 문제인:
    • 특정 집단이 과대표집되거나 소외되는 sampling 이 대표적인 예임.
    • randomness가 원인이 아니라 잘못된 방법론에서 발생.

대표적 예는 다음과 같음:

  • 전화 여론조사에서 집 전화 있는 사람만 조사 => 젊은 층 과소대표.
  • 온라인 설문조사에서 적극적으로 응답하는 사람만 포함 => 극단적 의견이 과대표.

비교

  • Sampling noise는 “우연히 생긴 변동(랜덤성)”이고, sample size를 늘리면 줄어듦.
  • Sampling bias는 “추출 과정 자체의 잘못(체계적 오류)”이고, sample size를 늘려도 계속 남음.

같이보면 좋은 자료들

2022.03.31 - [.../Math] - [Statistics] Central Limit Theorem

 

[Statistics] Central Limit Theorem

Central Limit Theorem (중심극한정리)mean의 sampling distribution의 다음과 같은 속성을 기술하는 Theorem이 Central Limit Theorem임.population이 무엇이든지 간에sample size ($N$, 1개의 sample의 element의 수)가 충분히 크

dsaint31.tistory.com

2024.02.23 - [.../Math] - [Math] Random Sampling

 

[Math] Random Sampling

Random SamplingRandom Sampling은 다음을 가르킴.Population(모집단)에서 element를 각각 무작위(random)로 선택하여 얻는sampling method(샘플링, 표본추출)을 가르킴. Statstics에서일반적으로 "제한된 수의 sample들로

dsaint31.tistory.com

2009.06.16 - [정리필요./방사선 계측] - Accuracy(정확도) vs. Precision(정밀도)

 

Accuracy(정확도) vs. Precision(정밀도)

이 두 용어의 차이를 정확히 알고 말하지 않는 경우가 생각보다 많다.사실 말하다보면 앞뒤 문맥으로 알 수는 있지만... 주의하자.Machine Learning의 classification에서의 accuracy와 precision은 조금 차이

dsaint31.tistory.com

 

 

728x90

'... > Math' 카테고리의 다른 글

Independent Poisson variables의 합과 상수곱  (0) 2025.10.14
Error Propagation (or Delta Method)  (0) 2025.10.08
Bayes' Theorem (Update Your Beliefs with Evidence)  (0) 2025.05.27
[Summary] 확률 및 통계 기본  (0) 2025.05.08
[Math] Gamma Function  (0) 2025.04.29
'.../Math' 카테고리의 다른 글
  • Independent Poisson variables의 합과 상수곱
  • Error Propagation (or Delta Method)
  • Bayes' Theorem (Update Your Beliefs with Evidence)
  • [Summary] 확률 및 통계 기본
dsaint31x
dsaint31x
    반응형
    250x250
  • dsaint31x
    Dsaint31's blog
    dsaint31x
  • 전체
    오늘
    어제
    • 분류 전체보기 (785)
      • Private Life (15)
      • Programming (55)
        • DIP (116)
        • ML (34)
      • Computer (119)
        • CE (53)
        • ETC (33)
        • CUDA (3)
        • Blog, Markdown, Latex (4)
        • Linux (9)
      • ... (368)
        • Signals and Systems (115)
        • Math (176)
        • Linear Algebra (33)
        • Physics (43)
        • 인성세미나 (1)
      • 정리필요. (61)
        • 의료기기의 이해 (6)
        • PET, MRI and so on. (7)
        • PET Study 2009 (1)
        • 방사선 장해방호 (5)
        • 방사선 생물학 (3)
        • 방사선 계측 (9)
        • 기타 방사능관련 (3)
        • 고시 (9)
        • 정리 (18)
      • RI (0)
      • 원자력,방사능 관련법 (2)
  • 블로그 메뉴

    • Math
    • Programming
    • SS
    • DIP
  • 링크

    • Convex Optimization For All
  • 공지사항

    • Test
    • PET Study 2009
    • 기타 방사능관련.
  • 인기 글

  • 태그

    opencv
    function
    linear algebra
    numpy
    math
    cv2
    ML
    signal_and_system
    Programming
    fourier transform
    Term
    SIGNAL
    인허가제도
    random
    signals_and_systems
    Python
    Probability
    Vector
    SS
    Optimization
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
dsaint31x
sampling error vs. sampling bias
상단으로

티스토리툴바