[Statistics] coefficient of determination (결정계수 ~ R squared)
·
Programming/ML
Coefficient of Determination데이터에 대한 현재 regression 모델의 성능(or 적합도)를 평가함 ▷ 1에 가까울수록 좋은 모델임: [0,1]통계 (linear model 한정, 더 정확하게는 OLS w/ intercept 한정)에서 사용되는 경우에는 최소값이 0이 보장되나,ML 분야에서 regression model의 성능 평가에 사용되는 경우 음수도 나올 수 있음 "평균(mena)으로만 예측하는 단순 모델"보다 성능이 떨어지는 경우 음수를 가짐.non-linear model 등에서 데이터셋이 매우 적거나 관련없는 데이터로 가득 차 있는 경우 음수가 되는 경우 많음.ML 등에서 regression model이 얼마나 정확하게 data에 fitting 되었는지를 나타내는 met..
[Statistics] Covariance vs. Correlation:
·
.../Math
Covariance (공분산)"Covariance" is the raw version of correlation.두 random variable(확률변수)가 얼마나 (선형적으로) 같이 변하는 정도를 나타냄.여러 random variables 에서는 matrix로 기재됨(covariance matrix, $\Sigma$).main diagonal은 자기자신과의 covariance, 즉 해당 확률변수 하나에 대한 variance임.matrix로 보여지는 경우엔 여러 random variable들이 있고 이들 중에 나올 수 있는 쌍에서의 covariance를 보여줌.항상 symmetric matrix 임. (every symmetric matrix is orthogonally diagonalizable)Cor..