[ML] Underfit

2023. 9. 21. 07:35·Programming/ML
728x90
728x90

Underfit이란

ML 모델이 주어진 훈련데이터를 제대로 학습하지 못하여 

Training dataset에서도 나쁜 performance를 보이는 경우를 가르킴.

 

Underfit의 경우 훈련데이터에서도 performance measure의 결과가 매우 나쁘게 나오기 때문에

훈련데이터에서 bias가 매우 크고, 대신 모델의 variance는 작은 특징을 보임.

  • bais 높다 = performance 가 나쁘다
  • variance가 낮은 이유는, 워낙 performance가 나쁘기 때문에 어떤 dataset에서도 일관되게 낮은 performance를 보이기때문임.

발생원인

  • Data의 features가 task를 해결하기 위한 정보가 부족한 경우 (non-representative data),
  • Model의 가설공간이 task에 맞지 않거나, 또는
  • Model이 task를 수행하기에 너무 단순(일반적으로 parameters의 수 부족)한 경우.

 

다음 그림은 non-linear한 task를 linear model로 접근하여 under-fitting이 발생한 경우를 나타냄.

해결방안

이를 해결하기 위한 방법은 간단히 말하면 다음과 같음.

  • 보다 복잡한 (~강력한) 모델 또는 현재 task에 적합한 가설에 기반한 모델을 사용한다.
    • 만약 현재 모델에 regularization이 가해져있는 경우라면, 해당 constraints를 약하게하거나 아예 제거한다.
  • Task와 관련된 features를 추가하거나, 현재의 데이터에 feature engineering 을 수행하여, representative dataset을 확보한다.
    • underfit의 경우, 현재 Data에서 양(qunatity)만을 증가시킨다고 해결되지 않음에 유의.
    • feature selection 또는 feature extraction등의 feature engineering을 수행하여 현재의 모델이 보다 쉽게 data 내부의 특성을 잘 학습하도록 하던지,
    • Task와 관련된 feature를 추가해주어야 함.

'Programming > ML' 카테고리의 다른 글

[Fitting] Total Least Square Regression  (1) 2024.06.22
[ML] RANdom SAmple Consensus (RANSAC)  (0) 2024.06.13
[ML] Feature Scaling  (0) 2024.05.04
[Statistics] coefficient of determination (결정계수 ~ R squared)  (0) 2024.05.01
[Fitting] Ordinary Least Squares : OLS, 최소자승법  (0) 2022.04.28
'Programming/ML' 카테고리의 다른 글
  • [ML] RANdom SAmple Consensus (RANSAC)
  • [ML] Feature Scaling
  • [Statistics] coefficient of determination (결정계수 ~ R squared)
  • [Fitting] Ordinary Least Squares : OLS, 최소자승법
dsaint31x
dsaint31x
    반응형
    250x250
  • dsaint31x
    Dsaint31's blog
    dsaint31x
  • 전체
    오늘
    어제
    • 분류 전체보기 (740)
      • Private Life (13)
      • Programming (186)
        • DIP (104)
        • ML (26)
      • Computer (119)
        • CE (53)
        • ETC (33)
        • CUDA (3)
        • Blog, Markdown, Latex (4)
        • Linux (9)
      • ... (351)
        • Signals and Systems (103)
        • Math (172)
        • Linear Algebra (33)
        • Physics (42)
        • 인성세미나 (1)
      • 정리필요. (54)
        • 의료기기의 이해 (6)
        • PET, MRI and so on. (1)
        • PET Study 2009 (1)
        • 방사선 장해방호 (4)
        • 방사선 생물학 (3)
        • 방사선 계측 (9)
        • 기타 방사능관련 (3)
        • 고시 (9)
        • 정리 (18)
      • RI (0)
      • 원자력,방사능 관련법 (2)
  • 블로그 메뉴

    • Math
    • Programming
    • SS
    • DIP
  • 링크

    • Convex Optimization For All
  • 공지사항

    • Test
    • PET Study 2009
    • 기타 방사능관련.
  • 인기 글

  • 태그

    math
    signals_and_systems
    SIGNAL
    SS
    Optimization
    Python
    opencv
    인허가제도
    fourier transform
    Probability
    Term
    검사
    function
    Vector
    linear algebra
    numpy
    Convolution
    signal_and_system
    Programming
    random
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
dsaint31x
[ML] Underfit
상단으로

티스토리툴바