기본 Term: Statistics
기술 통계와 추론 통계의 주요 개념들,
그리고 관련 용어들에 대한 소개
1. Statistics (통계)의 종류
1-1. Descriptive Statistics (기술 통계)
어떤 data set을 statistics(통계치)를 통해 기술해주는 것을 가르킴.
즉, 데이터의 특징을 요약하고 이해할 수 있는 값(=measures)인 statistics(통계치)를 계산함.
다음은 데이터의 특징을 나타내주는 measures (or statistics) 중 대표적인 것임.
- 평균 (mean): 전체 데이터의 대표적인 값.
- 중앙값 (median): 데이터를 오름차순으로 정렬했을 때 가운데 값.
- 표준 편차 (standard deviation): 데이터가 평균으로부터 얼마나 퍼져 있는지를 정량적으로 나타냄
- 최댓값 (maximum): 데이터 중 가장 큰 값을 나타냄.
- 최솟값 (minimum): 데이터 중 가장 작은 값을 나타냄.
2023.04.13 - [.../Math] - [Math] Mean : Measures of Central Tendency
2024.04.17 - [.../Math] - [Math] Variance and Standard Deviation: Measure of Dispersion
Descriptive Statistics는
- 인간이 data (or dataset)의 전체적인 모습 및 경향을 이해하는 데 도움을 줌.
- 데이터에 대한 더 깊은 insight을 얻기 위해 필요한 통계적 분석을 의미함.
1-2. Inferential Statistics (추론 통계)
descriptive statistics는 data set을 단순히 기술(description)하는 데 반하여,
Inferential statistics는 현재 값을 알고 있는 sample dataset으로부터,
해당 sample에 대응하는 population (전체 집단,모집단)의 parameters (모수)에 대한 inference(추론)을 하는 통계임.
sample로부터 population(전체 집단 or 모집단)에 대한 일반적인 결론을 내리는 과정.
예를 들어,
- 특정 학급의 학생들을 대상으로 어떤 실험을 통해 학습 성과를 측정하고,
- 그 결과를 바탕으로 전체 학생 집단의 학습 성과에 대한 일반적인 결론을 내리는 경우,
- Inferential statistics가 사용됨.
추론 통계는 일반적으로 다음과 같은 과정을 통해 진행됨:
- (Random) Sampling: 전체 집단에서 무작위로 표본을 추출.
- Sample Analysis and Test: Sample를 사용하여 "statistical test(통계적 검정)"을 실시.
- Inference (추론): 표본 데이터로부터 얻은 결과를 바탕으로 전체 집단에 대한 결론을 내립니다.
2. 관련 기본 용어 (정의)
2.1. Population:
- Entire (or Complete) set (or group) of events in which you are interested in studying.
2.2. Sample (표본):
- Set of actual observations; subset of a population.
- 모집단에서 sampling(일반적으로 무작위로 추출)된 일부 데이터이며 측정치를 알고 있는 dataset을 가르킴.
2.3. Statistics (통계치):
- Numerical values summarizing sample data.
- parameter를 예측하기 위해 sample로부터 계산된 estimation(추정치)이라고도 볼 수 있음.
2.4. Parameters (모수 or 모수치):
- Numerical values summarizing population data.
- population의 특징을 나타내는 수.
- population을 대표하는 수치이며, population의 모든 요소를 사용하여 계산됨.
2024.05.02 - [분류 전체보기] - [Statistics] Example: Parameter vs. Statistics
2.5. Random sample (무선표본):
- A sample in which each member of the population has an equal chance of inclusion.
2024.02.23 - [.../Math] - [Math] Random Sampling
2.6. Measurement (측정):
- The assignment of numbers to objects.
- 관심 대상이 되는 속성이나 개념을 일정한 규칙(~scale)에 따라 정량적 수치를 부여하는 과정.
- 측정의 도구 중 scale 이 있음.
2023.03.15 - [.../Math] - [Math] Type of Data and Scale of Measurement
'... > Math' 카테고리의 다른 글
[Statistics] covariate (공변량) (0) | 2024.02.23 |
---|---|
[Math] 용어: Variable (변수) 과 Variates (변량) (0) | 2024.02.23 |
[Math] Random이란? (1) | 2024.02.23 |
[Math] Random Sampling (0) | 2024.02.23 |
[Math] 용어: root, equality, expression (0) | 2024.02.20 |