[Math] 기본 Term: Statistics

2024. 2. 23. 15:55·.../Math
728x90
728x90

기본 Term: Statistics

기술 통계와 추론 통계의 주요 개념들,
그리고 관련 용어들에 대한 소개

1. Statistics (통계)의 종류

1-1. Descriptive Statistics (기술 통계)

어떤 data set을 statistics(통계치)를 통해 "기술"해주는 것을 가르킴.

즉, 데이터의 특징을 요약하고 이해할 수 있는 값(=measures)인 statistics(통계치)를 계산함.

다음은 데이터의 특징을 나타내주는 measures (or statistics) 중 대표적인 것임.

  • 평균 (mean): 전체 데이터의 대표적인 값.
  • 중앙값 (median): 데이터를 오름차순으로 정렬했을 때 가운데 값.
  • 표준 편차 (standard deviation): 데이터가 평균으로부터 얼마나 퍼져 있는지를 정량적으로 나타냄
  • 최댓값 (maximum): 데이터 중 가장 큰 값을 나타냄.
  • 최솟값 (minimum): 데이터 중 가장 작은 값을 나타냄.

2023.04.13 - [.../Math] - [Math] Mean : Measures of Central Tendency

 

[Math] Mean : Measures of Central Tendency

Mean: Measures of Central Tendencymean이나 average는어떤 Data(수들의 집단, 집합)을 나타내는(대표하는, represent) 하나의 수임. 어떤 값들의 분포(distribution)의 중앙을 나타내는 값을 Measure of Central Tendency라

dsaint31.tistory.com

 

2024.04.17 - [.../Math] - [Math] Variance and Standard Deviation: Measure of Dispersion

 

[Math] Variance and Standard Deviation: Measure of Dispersion

Variance and Standard Deviation: Measure of Dispersion Measure of Central Tendency, 즉 현재 sampel의 representation인 mean을 통해 해당 sample의 모든 cases를 하나의 값으로 표현하는 경우, 해당 representation이 sample의 각각의

dsaint31.tistory.com

 

Descriptive Statistics는

  • 인간이 data (or dataset)의 전체적인 모습 및 경향을 이해하는 데 도움을 줌.
  • 데이터에 대한 더 깊은 insight을 얻기 위해 필요한 통계적 분석을 의미함.

1-2. Inferential Statistics (추론 통계)

descriptive statistics는 data set을 단순히 기술(description)하는 데 반하여,

Inferential statistics는 현재 값을 알고 있는 sample dataset으로부터,

해당 sample에 대응하는 population (전체 집단,모집단)의 parameters (모수)에 대한 "inference(추론)"을 하는 통계임.

 

 

sample로부터 population(전체 집단 or 모집단)에 대한
일반적인 결론을 내리는 과정.

 

예를 들어,

  • 특정 학급의 학생들을 대상으로 어떤 실험을 통해 학습 성과를 측정하고,
  • 그 결과를 바탕으로 전체 학생 집단의 학습 성과에 대한 일반적인 결론을 내리는 경우,
  • Inferential statistics가 사용됨.

추론 통계는 일반적으로 다음과 같은 과정을 통해 진행됨:

  1. (Random) Sampling: 전체 집단에서 무작위로 표본을 추출.
  2. Sample Analysis and Test: Sample를 사용하여 "statistical test(통계적 검정)"을 실시.
  3. Inference (추론): 표본 데이터로부터 얻은 결과를 바탕으로 전체 집단에 대한 결론을 내립니다.

2. 관련 기본 용어 (정의)

2.1. Population:

  • Entire (or Complete) set (or group) of events in which you are interested in studying.

2.2. Sample (표본):

  • Set of actual observations; subset of a population.
  • 모집단에서 sampling(일반적으로 무작위로 추출)된 일부 데이터이며 측정치를 알고 있는 dataset을 가르킴.

2.3. Statistics (통계치):

  • Numerical values summarizing sample data.
  • parameter를 예측하기 위해 sample로부터 계산된 estimation(추정치)이라고도 볼 수 있음.

2.4. Parameters (모수 or 모수치):

  • Numerical values summarizing population data.
  • population의 특징을 나타내는 수.
  • population을 대표하는 수치이며, population의 모든 요소를 사용하여 계산됨.
더보기

2024.05.02 - [분류 전체보기] - [Statistics] Example: Parameter vs. Statistics

 

[Statistics] Example: Parameter vs. Statistics

모수(Parameters)와 통계치(Statistics)의 차이점으로 올바른 것은?  A) 모수는 표본에, 통계치는 모집단에 기반한다. B) 통계치는 표본에, 모수는 모집단에 기반한다. C) 모수와 통계치 모두 표본에 기

dsaint31.tistory.com


2.5. Random sample (무선표본):

  • A sample in which each member of the population has an equal chance of inclusion.

2024.02.23 - [.../Math] - [Math] Random Sampling

 

[Math] Random Sampling

Random SamplingRandom Sampling은 다음을 가르킴.Population(모집단)에서 element를 각각 무작위(random)로 선택하여 얻는sampling method(샘플링, 표본추출)을 가르킴. Statstics에서일반적으로 "제한된 수의 sample들로

dsaint31.tistory.com

 

참고: Random이란?

2024.02.23 - [.../Math] - [Math] Random이란?

 

[Math] Random이란?

RandomRandom은 주로 non-determinstic인 "정해진 패턴 또는 순서없이" 결과가 발생하는 것을 의미하는 경우가 많다. Deterministc인 경우,function (or differential equation) 등을 이용한 모델링을 통해,inputs 에 대한

dsaint31.tistory.com


2.6. Measurement (측정):

  • The assignment of numbers to objects.
  • 관심 대상이 되는 속성이나 개념을 일정한 규칙(~scale)에 따라 정량적 수치를 부여하는 과정.
  • 측정의 도구 중 scale 이 있음.

2023.03.15 - [.../Math] - [Math] Type of Data and Scale of Measurement

 

[Math] Type of Data and Scale of Measurement

Type of Data and Scale of Measurement1. Type of Data1-1. Measurement data (quantitative data)Measurement(측정)의 결과로 얻어진 data. 예를 든다면, 스트레스지수, 체중, 하루당 마시는 술의 양 등이 이에 해당한다.Data obtai

dsaint31.tistory.com


 

728x90

'... > Math' 카테고리의 다른 글

[Statistics] covariate (공변량)  (0) 2024.02.23
[Math] 용어: Variable (변수) 과 Variates (변량)  (0) 2024.02.23
[Math] Random이란?  (1) 2024.02.23
[Math] Random Sampling  (0) 2024.02.23
[Math] 용어: root, equality, expression  (0) 2024.02.20
'.../Math' 카테고리의 다른 글
  • [Statistics] covariate (공변량)
  • [Math] 용어: Variable (변수) 과 Variates (변량)
  • [Math] Random이란?
  • [Math] Random Sampling
dsaint31x
dsaint31x
    반응형
    250x250
  • dsaint31x
    Dsaint31's blog
    dsaint31x
  • 전체
    오늘
    어제
    • 분류 전체보기 (787)
      • Private Life (15)
      • Programming (206)
        • DIP (116)
        • ML (35)
      • Computer (120)
        • CE (54)
        • ETC (33)
        • CUDA (3)
        • Blog, Markdown, Latex (4)
        • Linux (9)
      • ... (368)
        • Signals and Systems (115)
        • Math (176)
        • Linear Algebra (33)
        • Physics (43)
        • 인성세미나 (1)
      • 정리필요. (61)
        • 의료기기의 이해 (6)
        • PET, MRI and so on. (7)
        • PET Study 2009 (1)
        • 방사선 장해방호 (5)
        • 방사선 생물학 (3)
        • 방사선 계측 (9)
        • 기타 방사능관련 (3)
        • 고시 (9)
        • 정리 (18)
      • RI (0)
      • 원자력,방사능 관련법 (2)
  • 블로그 메뉴

    • Math
    • Programming
    • SS
    • DIP
  • 링크

    • Convex Optimization For All
  • 공지사항

    • Test
    • PET Study 2009
    • 기타 방사능관련.
  • 인기 글

  • 태그

    cv2
    fourier transform
    math
    Vector
    Programming
    SS
    numpy
    ML
    opencv
    Optimization
    SIGNAL
    signals_and_systems
    linear algebra
    random
    인허가제도
    Term
    signal_and_system
    Probability
    Python
    function
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
dsaint31x
[Math] 기본 Term: Statistics
상단으로

티스토리툴바