[Statistics] Tail, Head, and Distribution (w/ Moment)

2024. 9. 26. 22:49·.../Math
728x90
728x90

확률 분포 등에서 헷갈리기 쉬운 tail, head 와 heavy tailed와 light tailed, 그리고 Right skewed 와 Left skewed를 정리.


1. Head

데이터 분포에서 중심부

주로 중앙값(median)의 위치라고 보면 거의 맞음.

mean을 사용하기도 하지만, heavy tailed나 skewed의 경우 mean은 적절치 못할 수 있음


2. Tail

극단적인 값들이 나타나는 끝부분을 의미

분포의 양끝에 있는 극단적인 값들로 구성.


 

3. Heavy-tailed 분포

 

  • Heavy-tailed 분포는 꼬리가 두꺼워 극단적인 값들이 자주 발생하는 분포입니다.
  • 꼬리가 천천히 0으로 수렴하며, 금융 시장에서의 큰 손실이나 자연 재해와 같은 드물고 극단적인 사건들을 잘 설명.
  • 참고
    • oai_citation:13,Heavy Tailed Distribution & Light Tailed Distribution: Definition & Examples - Statistics How To
    • oai_citation:12,Heavy Tailed Distribution & Light Tailed Distribution: Definition & Examples - Statistics How To.
  • Moments
    • 1차 모멘트(mean):
      • mean이 안정적이지 못함(워낙 극단적인 outlier가 많아서) : 예를 들어, Cauchy 분포
      • 이런 경우, 평균보다 중앙값(median)이 데이터를 더 잘 설명할 수 있음.
    • 2차 모멘트(variance):
      • variance가 매우 큼.
      • 극단적인 값들이 분포의 끝에 몰려 있기 때문.
    • 3차 모멘트(왜도, Skewness):
      • Heavy-tailed 분포는 좌우 대칭이 아닌 경우
      • 양의 왜도 또는 음의 왜도를 가질 수 있음.
    • 4차 모멘트(첨도, Kurtosis):
      • Kurtosis(첨도)가 3 초과(Leptokurtic)
      • 즉, 꼬리가 두껍고 극단적인 값들이 많이 존재.

4. Light-tailed 분포

  • Light-tailed 분포는 꼬리가 얇아 극단적인 값들이 거의 나타나지 않음
  • 값들이 주로 중앙에 몰려 있음.
  • 정규분포나 지수분포가 대표적입니다
  • 참고:
    • oai_citation:8,Heavy Tailed Distribution & Light Tailed Distribution: Definition & Examples - Statistics How To
    • oai_citation:7,Kurtosis: Definition, Leptokurtic & Platykurtic - Statistics By Jim.
  • Moment
    • 1차 모멘트(mean):
      • 평균이 잘 정의되며, 데이터가 중심에 집중됨.
    • 2차 모멘트(variance):
      • 분산도 잘 정의됨 (지나치게 크지 않음).
  • 3차 모멘트(왜도, Skewness):
    • 정규분포의 경우 왜도는 0으로, 대칭적인 형태.
  • 4차 모멘트(첨도, Kurtosis):
    • 정규분포의 첨도는 3으로,
    • 이를 기준으로 첨도가 3보다 작으면 Platykurtic (꼬리가 얇음)으로 간주

5. Right-skewed (Positive Skewed) 분포

  • Right-skewed 분포
    • 꼬리가 오른쪽으로 길며,
    • mean이 median보다 큼.
    • 예로는 고소득층 소득 분포가 있으며 흔히 발견됨.
  • Moments
    • 1차 모멘트(mean): mean > median
    • 2차 모멘트(variance): 극단적인 높은 값들 때문에 variance가 큼.
    • 3차 모멘트(왜도, Skewness): positive의 왜도를 가지며, tail이 오른쪽으로 길게 분포.
    • 4차 모멘트(첨도, Kurtosis): 정규분포보다 평평하며 꼬리가 얇으면 첨도가 3보다 작을 수 있음 / 정규분포보다 뾰족하고 꼬리가 두꺼우면 첨도가 3보다 클 수 있음.

4. Left-skewed (Negative Skewed) 분포

  • Left-skewed 분포
    • 꼬리가 왼쪽으로 길며,
    • mean이 median보다 작음.
    • 예로는 시험 점수 분포에서 대부분의 학생이 높은 점수를 받고, 일부 극단적으로 낮은 점수가 평균을 끌어내리는 경우 등이 있음.
  • Moments
    • 1차 모멘트(mean): mean < median
    • 2차 모멘트(variance): 극단적인 낮은 값 때문에 variance가 커질 수 있음.
    • 3차 모멘트(왜도, Skewness): negative(음)의 왜도를 가지며, 꼬리가 왼쪽으로 길게 분포.
    • 4차 모멘트(첨도, Kurtosis): 정규분포보다 평평하며 꼬리가 얇으면 첨도가 3보다 작을 수 있음 / 정규분포보다 뾰족하고 꼬리가 두꺼우면 첨도가 3보다 클 수 있음.

5. 요약:

  • 1차 모멘트: mean (데이터의 중심 위치)
  • 2차 모멘트: variance (데이터의 퍼짐 정도)
  • 3차 모멘트: skewness (분포의 비대칭성)
  • 4차 모멘트: kurtosis (꼬리 두께, 극단값 발생 빈도)

이러한 moments은

  • 분포의 특성을 수치적으로 설명하며,
  • 데이터 분석에서 분포를 이해하는 데 중요한 역할을 합니다

같이 보면 좋은 자료들

2022.03.31 - [.../Math] - [Statistics] Moment (Probability Moment)

 

[Statistics] Moment (Probability Moment)

1. Moment (Probability Moment) : Statistics💡 statistics에서 moment는 probability distribution에서 계산되어진 특징값확률 분포를 이용하여 구해지는 random variable의 대표값(or 통계량)을 일반화(generalization)시킨 것

dsaint31.tistory.com

 

2022.05.09 - [.../Physics] - [Physics] Moment (모멘트)

 

[Physics] Moment (모멘트)

Moment (모멘트)어떤 물리적인 effect(e.g.회전운동)등을 정량화하는 물리량의 일종으로 그 크기가하나의 물리량(e.g. mass) 뿐 아니라해당 물리량의 분포(or 위치) 까지 고려하여정해지는 경우 moment라

dsaint31.tistory.com

 

oai_citation:2,Heavy Tailed Distribution & Light Tailed Distribution: Definition & Examples - Statistics How To

 

 

oai_citation:1,Kurtosis: Definition, Leptokurtic & Platykurtic - Statistics By Jim

 

 

'... > Math' 카테고리의 다른 글

[Math] Basis  (0) 2024.10.28
[Math] Inner Product (or Hermitian Inner Product, 내적)  (5) 2024.10.28
[Math] Algebraic Properties  (0) 2024.07.20
[Math] Identity (항등원) and Inverse (역원)  (0) 2024.07.20
[Math] Term: Algebra란? (대수란?)  (1) 2024.07.20
'.../Math' 카테고리의 다른 글
  • [Math] Basis
  • [Math] Inner Product (or Hermitian Inner Product, 내적)
  • [Math] Algebraic Properties
  • [Math] Identity (항등원) and Inverse (역원)
dsaint31x
dsaint31x
    반응형
    250x250
  • dsaint31x
    Dsaint31's blog
    dsaint31x
  • 전체
    오늘
    어제
    • 분류 전체보기 (739)
      • Private Life (13)
      • Programming (56)
        • DIP (104)
        • ML (26)
      • Computer (119)
        • CE (53)
        • ETC (33)
        • CUDA (3)
        • Blog, Markdown, Latex (4)
        • Linux (9)
      • ... (350)
        • Signals and Systems (103)
        • Math (171)
        • Linear Algebra (33)
        • Physics (42)
        • 인성세미나 (1)
      • 정리필요. (54)
        • 의료기기의 이해 (6)
        • PET, MRI and so on. (1)
        • PET Study 2009 (1)
        • 방사선 장해방호 (4)
        • 방사선 생물학 (3)
        • 방사선 계측 (9)
        • 기타 방사능관련 (3)
        • 고시 (9)
        • 정리 (18)
      • RI (0)
      • 원자력,방사능 관련법 (2)
  • 블로그 메뉴

    • Math
    • Programming
    • SS
    • DIP
  • 링크

    • Convex Optimization For All
  • 공지사항

    • Test
    • PET Study 2009
    • 기타 방사능관련.
  • 인기 글

  • 태그

    Term
    numpy
    fourier transform
    검사
    opencv
    function
    Vector
    random
    SIGNAL
    인허가제도
    signals_and_systems
    Probability
    linear algebra
    Convolution
    SS
    Optimization
    signal_and_system
    math
    Programming
    Python
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
dsaint31x
[Statistics] Tail, Head, and Distribution (w/ Moment)
상단으로

티스토리툴바