Optimism-corrected Accuracy
·
Programming/ML
Optimism-corrected accuracy는bootstrap sampling을 통해resubstitution accuracy에 포함된 낙관적 bias를추정하고 보정한 accuracy임.여기서 optimism은 다음을 의미함.model이 학습에 사용한 data에서 평가될 때, 실제 일반화 성능보다 성능이 좋게 나오는 정도 즉, training data에서 다시 평가한 성능은 보통 실제 성능보다 높게 나온다. 이를 apparent performance 또는 resubstitution performance라고 부른다. 이 외의 bootstrap에서 사용되는 metrics에 대해선 다음을 참고:2026.04.14 - [Programming/ML] - Bootstrap Sampling 기반 Accuracy..
Balanced Accuracy (균형 정확도)
·
Programming/ML
Balanced Accuracy(균형 정확도) 는class imbalance(클래스 불균형) 가 있는 classification(분류) 문제에서 사용하는evaluation metric(평가지표)임.Ordinary Accuracy일반적인 Accuracy(정확도) 는 전체 sample 중 맞춘 비율임.$$\text{Accuracy} = \frac{\text{맞춘 sample 수}}{\text{전체 sample 수}}$$ 하지만,특정 class의 sample 수가 매우 많으면,model(모델)이 majority class(다수 클래스)만 잘 맞춰도accuracy가 높게 나올 수 있음.Balanced Accuray앞서의 class imbalance 에서의 일반 accuracy가 가지는 문제점을 극복하기 위해각 ..
[ML] BFGS, L-BFGS, L-BFGS-B : Quasi-Newton method
·
Programming/ML
[BFGS]BFGS(Broyden-Fletcher-Goldfarb-Shanno algorithm)는 대표적인 Quasi-Newton method(준-뉴턴 방법) 중 하나임.고차원 문제에서는 L-BFGS가 더 많이 사용됨L-BFGS 는 BFGS가 전체 matrix를 메모리에 적재하는 것을 개선한 버전으로 주로 많이 이용됨(L= Limited-meory) 더보기BFGS는 1970년에 4명의 연구자 (Broyden-Fletcher-Goldfarb-Shanno 가 독립적으로 서로 다른 방식의 접근을 통해 동일한 업데이트식을 도출해 낸 걸로 유명한 알고리즘. 이들 4명의 연구자들의 이름을 따서 BFGS 가 됨. 당시 널리 사용되던 DFP(Davidon-Fletcher-Powell) 방법의 단점을 보완하기 위해 개..
Linear Regression (Summary)
·
Programming/ML
0. Linear Regression 분류Linear Regression ├── 1. Error model 기준 │ ├── OLS 계열 │ │ ├── X: fixed or error-free │ │ ├── y: noise 있음 │ │ └── $\text{Var}(\varepsilon) = \sigma^2\mathbf{I}$│ │ │ ├── WLS 계열 │ │ ├── X: fixed or error-free │ │ ├── y: n..
Bootstrap Sampling 기반 Accuracy 추정 지표
·
Programming/ML
0. 왜 Bootstrap Accuracy Estimation이 필요한가모델 성능 평가의 이상적인 방법은 독립적인 test set을 사용하는 것임.하지만 데이터가 부족한 경우, 충분한 test set을 확보하기 어려움.Bootstrap accuracy estimation은복원 추출(sampling with replacement) 을 반복(Bootstrap Iteration)하여하나의 dataset으로 여러 training/evaluation 조합을 만들고 이를 통해 모델의 일반화 성능을 추정하는 방법임.단일 train/test split 의 경우와 비교하여 "분산(variance)을 줄인 보다 안정적인 성능 추정" 이 가능 2024.06.05 - [.../Math] - [ML] Bootstrap Samp..
XAI: Coefficient, Feature importance, and SHAP
·
Programming/ML
XAI는 eXplainable AI의 약어로,AI 모델이 왜 이같은 예측(결과)을 내어놓았는지를 설명하는 기술을 가리킴. 이 글은 XAI에서 사용되는 도구들인coefficient,feature importanceSHAP를 비교 설명함.사실 SHAP를 설명하기 위한 글로,통계분석이나 classic ML의 사용자들에게 익숙한 coefficient와 feautre importance를 통해SHAP의 특징을 설명하는 글임.coefficientcoefficient는 변수에 곱해지는 상수를 가리키는 용어로,ML에선 다음을 의미함:보통 선형모델(linear model), 예를 들어Linear Regression이나Logistic Regression에서변수에 곱해지는 계수를 가리킴 (parameter, weight)...