[Math] Multi-variable vs. Multi-variate and Multiple Regression

2022. 11. 17. 12:32·.../Math
728x90
728x90

1. Multi-Variable vs Multi-Variate (in Regression)

Regression에서 많이 사용되는 경우이며, 위의 용어에서 Variable은 독립변수에 해당하며, Variate는 종속변수에 해당함.

  •  variable (변수) : 독립변수에 해당.
    • univariable : independent variable이 scalar.
    • multi-variable : independent variable이 vector.
      • 하지만 Multiple Regression이라고 불림. 
      • 즉, 독립변수가 여러 개 (=vector가 독립변수)인 경우, Multiple Regression이라고 불림.
  •  variate (변량) : 종속변수에 해당
    • univariate : dependent variable이 scalar. (하나의 식(single row)에서 scalar이므로 design matrix로 표현시 vector가 됨)
    • multi-variate : dependent variable이 vector임.(하나의 식(single row)에서 vector이므로 design matrix로 표현시 matrix가 됨)

참고 : Multi-Variate function

Regression과 달리 일반적으로는 

Multi-Variate Function은 독립변수가 vector이고, 종속변수가 scalar인 경우에도 많이 사용됨.

 

엄밀하게는 틀린 거 같은데...

(엄밀하게는 종속변수가 다차원 vector인 경우를 가르키는게 맞다.)

  • 워낙 많이 사용되다 보니 문맥에 따라 파악하는 게 좋다.
  • multi-variate function의 경우 종속변수가 scalar로 한정하는 경우로도 자주 사용된다는 점을 기억하자.

Function에 대해 정리하면 다음과 같음.

  • 정의역(domain)이  $\mathbb{R}$ 이면서 공역(codomain)이 $\mathbb{R}^n$ 인 경우, vector function (or single-variable vector-valued function or single variate vector-valued function).
  • 정의역(domain)이  $\mathbb{R}^n$ 이면서 공역(codomain)이  $\mathbb{R}^n$ 인 경우, vector field (or multivariable vector-valued function or multivariate vector-valued function).
  • 정의역(domain)이  $\mathbb{R}$ 이면서 공역(codomain)이 $\mathbb{R}$ 인 경우, scalar function.
  • 정의역(domain)이  $\mathbb{R}^n$ 이면서 공역(codomain)이 $\mathbb{R}$ 인 경우, scalar field (or multi-variable function or multi-variate function).

2. Multiple Regression (중다회귀)

statistics에서 사용되는 용어로, multi-variable regression을 의미함.
multiple regression의 경우, dependent variable이 하나로서, 이를 matrix equation으로 보면 다음과 같음.
$$
\textbf{y}=X\beta +\epsilon
$$
where

  • $\textbf{y}$ : row개 만큼의 sample들로부터 얻어진 observed value들. (dependent variable, univariate)
  • $\beta$ : 위의 linear model의 (unknown) parameter들을 component로 가지는 vector.
    • linear model이라고 불리는 이유는 이들 unknown parameter에 대해 linear하기 때문임. (independent variable에 대해서는 non-linear일 수 있음: affine)
    • model의 weight가 되며, $\textbf{y}$가 scalar이므로 vector임.
  • $X$ : design matrix. regression에 사용된 sample들의 수만큼을 row로 가지며, independent variable의 수 이상(bias, 다른 independent variable간의 곱, 각 independent varible의 거듭제곱 등이 포함될 수 있음)의 column을 가짐.
    • sample이 3개이고, 2개의 independent variable $u$, $v$ 를 degree=2로 regression model을 만든다면 다음과 같은 design matrixk가 됨.
    • $X=\begin{bmatrix} 1 & u_1 & v_1 & u_1^2 & v_1^2 & u_1v_1 \\ 1 & u_2 & v_2 & u_2^2 & v_2^2 & u_2v_2 \\ 1 & u_3 & v_3 & u_3^2 & v_3^2 & u_3v_3 \end{bmatrix}$
    • 위의 design matrix에서 subscript는 sample 번호로 $[1,3]$임.
    • 전체 model의 matrix equation은 다음과 같음.
    • $\begin{bmatrix}y_1\\y_2\\y_3\end{bmatrix}= X\begin{bmatrix}\beta_0\\\beta_1\\\beta_2\\\beta_3 \\ \beta_4 \\ \beta_5 \end{bmatrix} +\begin{bmatrix}\epsilon_1\\\epsilon_2\\\epsilon_3\end{bmatrix}$
  • $\epsilon$ : residual vector (=error). 각 sample에서 observed value와 predicted value간의 오차를 component로 가지는 vector

많은 경우의 regression에서 dependent variable이 scalar이며, multiple regression(or multi-variable regression)임
즉, 종속변수는 scalar이고 독립변수는 vector임.

하지만, variate와 variable의 구분이 혼재되어 (다르게?) 사용되는 경우가 많으니 주의해야함. 


더 읽어보면 좋은 자료들

https://dsaint31.tistory.com/entry/Function-%ED%95%A8%EC%88%98-%EA%B0%84%EB%9E%B5-%EC%A0%95%EC%9D%98

 

[Math] Function (함수): 간략 정의

Function은 흔히 mapping(사상), transformation(변환)이라는 용어로 불리기도 함. set으로 정의한다면, domain(정의역: 일종의 set)의 각 element에 대해co-domain(공역: 역시 일종의 set)의 elements 중 오직 하나 로

dsaint31.tistory.com

 

2024.02.23 - [.../Math] - [Math] Variable (변수)

 

[Math] 용어: Variable (변수) 과 Variates (변량)

Variable (변수) 과 Variates (변량)0. Variable이란 변수다른 값을 가질 수 있는 대상(Object)이나 사건(Event)의 속성을 가르킴. 통계 등에서 사용되는 용어로 애기하면,Variable이란 척도(scale)를 이용하여 측

dsaint31.tistory.com

 

https://stats.stackexchange.com/questions/447455/multivariable-vs-multivariate-regression

 

Multivariable vs multivariate regression

I am a little unsure about the semantics in this regard, and was hoping someone could cast some light on this. As far as I understand, multivariable is basically one dependent variable and several

stats.stackexchange.com

 

https://mansoostat.tistory.com/23

 

Univariate,Multivariate vs. Univariable,Multivariable

논문을 보다 보면 multivariable과 multivariate이라는 단어가 의미에 맞지 않게 잘못 혼용된 경우를 종종 보곤 한다. 심지어 같은 분석 내용에 대해 표에는 multivariate으로 표시하고 본문에는 multivariable

mansoostat.tistory.com

 

728x90

'... > Math' 카테고리의 다른 글

[LA] Orthogonal Matrix (직교행렬) and Orthonormal Vector  (0) 2022.11.17
[LA] Normal Matrix (정규행렬)  (0) 2022.11.17
[Math] Random Experiment (확률 실험, Trial, 시행)와 Event  (1) 2022.10.14
[Math] Sample Space (표본공간)  (0) 2022.10.14
[Math] Definition : Random Process  (0) 2022.10.14
'.../Math' 카테고리의 다른 글
  • [LA] Orthogonal Matrix (직교행렬) and Orthonormal Vector
  • [LA] Normal Matrix (정규행렬)
  • [Math] Random Experiment (확률 실험, Trial, 시행)와 Event
  • [Math] Sample Space (표본공간)
dsaint31x
dsaint31x
    반응형
    250x250
  • dsaint31x
    Dsaint31's blog
    dsaint31x
  • 전체
    오늘
    어제
    • 분류 전체보기 (781)
      • Private Life (13)
      • Programming (205)
        • DIP (116)
        • ML (34)
      • Computer (119)
        • CE (53)
        • ETC (33)
        • CUDA (3)
        • Blog, Markdown, Latex (4)
        • Linux (9)
      • ... (366)
        • Signals and Systems (113)
        • Math (176)
        • Linear Algebra (33)
        • Physics (43)
        • 인성세미나 (1)
      • 정리필요. (61)
        • 의료기기의 이해 (6)
        • PET, MRI and so on. (7)
        • PET Study 2009 (1)
        • 방사선 장해방호 (5)
        • 방사선 생물학 (3)
        • 방사선 계측 (9)
        • 기타 방사능관련 (3)
        • 고시 (9)
        • 정리 (18)
      • RI (0)
      • 원자력,방사능 관련법 (2)
  • 블로그 메뉴

    • Math
    • Programming
    • SS
    • DIP
  • 링크

    • Convex Optimization For All
  • 공지사항

    • Test
    • PET Study 2009
    • 기타 방사능관련.
  • 인기 글

  • 태그

    Optimization
    opencv
    random
    math
    signals_and_systems
    Vector
    signal_and_system
    cv2
    function
    SS
    linear algebra
    fourier transform
    Python
    SIGNAL
    numpy
    Term
    인허가제도
    Programming
    ML
    Probability
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
dsaint31x
[Math] Multi-variable vs. Multi-variate and Multiple Regression
상단으로

티스토리툴바