확률 분포 등에서 헷갈리기 쉬운 tail, head 와 heavy tailed와 light tailed, 그리고 Right skewed 와 Left skewed를 정리.
1. Head
데이터 분포에서 중심부
주로 중앙값(median)의 위치라고 보면 거의 맞음.
mean을 사용하기도 하지만, heavy tailed나 skewed의 경우 mean은 적절치 못할 수 있음
2. Tail
극단적인 값들이 나타나는 끝부분을 의미
분포의 양끝에 있는 극단적인 값들로 구성.
3. Heavy-tailed 분포
- Heavy-tailed 분포는 꼬리가 두꺼워 극단적인 값들이 자주 발생하는 분포입니다.
- 꼬리가 천천히 0으로 수렴하며, 금융 시장에서의 큰 손실이나 자연 재해와 같은 드물고 극단적인 사건들을 잘 설명.
- 참고
- Moments
- 1차 모멘트(mean):
- mean이 안정적이지 못함(워낙 극단적인 outlier가 많아서) : 예를 들어, Cauchy 분포
- 이런 경우, 평균보다 중앙값(median)이 데이터를 더 잘 설명할 수 있음.
- 2차 모멘트(variance):
- variance가 매우 큼.
- 극단적인 값들이 분포의 끝에 몰려 있기 때문.
- 3차 모멘트(왜도, Skewness):
- Heavy-tailed 분포는 좌우 대칭이 아닌 경우
- 양의 왜도 또는 음의 왜도를 가질 수 있음.
- 4차 모멘트(첨도, Kurtosis):
- Kurtosis(첨도)가 3 초과(Leptokurtic)
- 즉, 꼬리가 두껍고 극단적인 값들이 많이 존재.
- 1차 모멘트(mean):
4. Light-tailed 분포
- Light-tailed 분포는 꼬리가 얇아 극단적인 값들이 거의 나타나지 않음
- 값들이 주로 중앙에 몰려 있음.
- 정규분포나 지수분포가 대표적입니다
- 참고:
- Moment
- 1차 모멘트(mean):
- 평균이 잘 정의되며, 데이터가 중심에 집중됨.
- 2차 모멘트(variance):
- 분산도 잘 정의됨 (지나치게 크지 않음).
- 1차 모멘트(mean):
- 3차 모멘트(왜도, Skewness):
- 정규분포의 경우 왜도는 0으로, 대칭적인 형태.
- 4차 모멘트(첨도, Kurtosis):
- 정규분포의 첨도는 3으로,
- 이를 기준으로 첨도가 3보다 작으면 Platykurtic (꼬리가 얇음)으로 간주
5. Right-skewed (Positive Skewed) 분포
- Right-skewed 분포
- 꼬리가 오른쪽으로 길며,
- mean이 median보다 큼.
- 예로는 고소득층 소득 분포가 있으며 흔히 발견됨.
- Moments
- 1차 모멘트(mean): mean > median
- 2차 모멘트(variance): 극단적인 높은 값들 때문에 variance가 큼.
- 3차 모멘트(왜도, Skewness): positive의 왜도를 가지며, tail이 오른쪽으로 길게 분포.
- 4차 모멘트(첨도, Kurtosis): 꼬리가 길면 첨도가 3보다 클 수 있음.
4. Left-skewed (Negative Skewed) 분포
- Left-skewed 분포
- 꼬리가 왼쪽으로 길며,
- mean이 median보다 작음.
- 예로는 시험 점수 분포에서 대부분의 학생이 높은 점수를 받고, 일부 극단적으로 낮은 점수가 평균을 끌어내리는 경우 등이 있음.
- Moments
- 1차 모멘트(mean): mean < median
- 2차 모멘트(variance): 극단적인 낮은 값 때문에 variance가 커질 수 있음.
- 3차 모멘트(왜도, Skewness): negative(음)의 왜도를 가지며, 꼬리가 왼쪽으로 길게 분포.
- 4차 모멘트(첨도, Kurtosis): 꼬리가 얇으면 첨도가 3보다 작을 수 있음.
5. 요약:
- 1차 모멘트: mean (데이터의 중심 위치)
- 2차 모멘트: variance (데이터의 퍼짐 정도)
- 3차 모멘트: skewness (분포의 비대칭성)
- 4차 모멘트: kurtosis (꼬리 두께, 극단값 발생 빈도)
이러한 moments은
- 분포의 특성을 수치적으로 설명하며,
- 데이터 분석에서 분포를 이해하는 데 중요한 역할을 합니다
같이 보면 좋은 자료들
2022.03.31 - [.../Math] - [Statistics] Moment (Probability Moment)
2022.05.09 - [.../Physics] - [Physics] Moment (모멘트)
oai_citation:1,Kurtosis: Definition, Leptokurtic & Platykurtic - Statistics By Jim
'... > Math' 카테고리의 다른 글
[Math] Basis (0) | 2024.10.28 |
---|---|
[Math] Inner Product (or Hermitian Inner Product, 내적) (5) | 2024.10.28 |
[Math] Algebraic Properties (0) | 2024.07.20 |
[Math] Identity (항등원) and Inverse (역원) (0) | 2024.07.20 |
[Math] Term: Algebra란? (대수란?) (1) | 2024.07.20 |