[ML] Diabetes Dataset

2024. 10. 5. 19:40·Programming/ML
728x90
728x90

이는 442명의 당뇨병 환자에 대한 진단 측정치로 구성됨.

  • 이는 regression models를 위한 dataset.
  • 9개의 features를 통해 당뇨병의 진행 정도를 예측.

seaborn을 이용한 pair plot!


Dataset 특징

  • 샘플 수: 442
  • 특성 수: 10
  • target: 1년 후 질병 진행의 정량적 측정치

Features

  1. age: 나이
  2. sex: 성별
  3. bmi: 체질량 지수 (Body Mass Index)
  4. bp: 평균 혈압 (Average Blood Pressure)
  5. s1: 혈청 (Serum) 측정치 1
  6. s2: 혈청 측정치 2
  7. s3: 혈청 측정치 3
  8. s4: 혈청 측정치 4
  9. s5: 혈청 측정치 5
  10. s6: 혈청 측정치 6

Target (or Label)

  • 1년 후의 질병 진행 정도를 나타내는 정량적 측정치

데이터 형태

  • 모든 feature는 standardization(표준화)되어 있음 (mean = 0, std = 1)

데이터셋 출처

  • Bradley Efron, Trevor Hastie, Iain Johnstone and Robert Tibshirani (2004) "Least Angle Regression," Annals of Statistics (with discussion), 407-499.
  • (http://web.stanford.edu/~hastie/Papers/LARS/LeastAngle_2002.pdf)

scikit-learn

from sklearn.datasets import load_diabetes
diabetes = load_diabetes()
X, y = diabetes.data, diabetes.target
728x90

'Programming > ML' 카테고리의 다른 글

[ML] Regularization  (0) 2024.10.27
[ML] Linear Classification Model: Hyperplane and Decision Boundary  (0) 2024.10.27
[ML] Yeast Dataset  (0) 2024.10.05
[ML] kNN Classifier (k-Nearest Neighbors Classifier)  (0) 2024.10.05
[ML] Imputation  (0) 2024.10.05
'Programming/ML' 카테고리의 다른 글
  • [ML] Regularization
  • [ML] Linear Classification Model: Hyperplane and Decision Boundary
  • [ML] Yeast Dataset
  • [ML] kNN Classifier (k-Nearest Neighbors Classifier)
dsaint31x
dsaint31x
    반응형
    250x250
  • dsaint31x
    Dsaint31's blog
    dsaint31x
  • 전체
    오늘
    어제
    • 분류 전체보기 (787)
      • Private Life (15)
      • Programming (206)
        • DIP (116)
        • ML (35)
      • Computer (120)
        • CE (54)
        • ETC (33)
        • CUDA (3)
        • Blog, Markdown, Latex (4)
        • Linux (9)
      • ... (368)
        • Signals and Systems (115)
        • Math (176)
        • Linear Algebra (33)
        • Physics (43)
        • 인성세미나 (1)
      • 정리필요. (61)
        • 의료기기의 이해 (6)
        • PET, MRI and so on. (7)
        • PET Study 2009 (1)
        • 방사선 장해방호 (5)
        • 방사선 생물학 (3)
        • 방사선 계측 (9)
        • 기타 방사능관련 (3)
        • 고시 (9)
        • 정리 (18)
      • RI (0)
      • 원자력,방사능 관련법 (2)
  • 블로그 메뉴

    • Math
    • Programming
    • SS
    • DIP
  • 링크

    • Convex Optimization For All
  • 공지사항

    • Test
    • PET Study 2009
    • 기타 방사능관련.
  • 인기 글

  • 태그

    Optimization
    signals_and_systems
    opencv
    random
    signal_and_system
    Term
    linear algebra
    numpy
    math
    Vector
    Python
    SS
    cv2
    인허가제도
    fourier transform
    Probability
    ML
    SIGNAL
    Programming
    function
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
dsaint31x
[ML] Diabetes Dataset
상단으로

티스토리툴바