[DIP] Contrast Limited Adaptive Histogram Equalization (CLAHE)
·
Programming/DIP
Global Histogram Equalization의 단점.Illumination이 불균일한 경우, 이미지에서 특정 부분은 밝고 특정 부분은 어두움.이 경우, Global Processing 기반의 Histogram Equalization은 효과가 좋지 못함. 아래 그림에서 조명이 불균일하여 global HE가 효과가 좋지 않음을 보여줌 (석고상의 대비가 오히려 나뻐짐)이를 개선한 방법이 Contrast Limited Adaptive Histogram Equalization (CLAHE)임. 관련 gisthttps://gist.github.com/dsaint31x/5606a3b51023d64f5e29ea524ac469dc dip_clahe.ipynbdip_clahe.ipynb. GitHub Gist: ..
[DIP] Histogram Matching: Image Enhancement
·
Programming/DIP
개념입력 영상(input image)의 히스토그램이 특정 모양의 히스토그램 분포(목표영상, target image의 histogram)를 가지도록 하여 영상의 명암 대비를 개선하는 기법: Image Enhancement히스토그램 정합 또는 히스토그램 명세화라 불리기도 함관련 gisthttps://gist.github.com/dsaint31x/601b29af3ef28ec17114d405de14cec9 dip_histogram_matching.ipynbdip_histogram_matching.ipynb. GitHub Gist: instantly share code, notes, and snippets.gist.github.com과정target image 에 대하여 Target Histogram을 구하고, 이..
[ML] Diabetes Dataset
·
Programming/ML
이는 442명의 당뇨병 환자에 대한 진단 측정치로 구성됨.이는 regression models를 위한 dataset.9개의 features를 통해 당뇨병의 진행 정도를 예측.Dataset 특징샘플 수: 442특성 수: 10target: 1년 후 질병 진행의 정량적 측정치Featuresage: 나이sex: 성별bmi: 체질량 지수 (Body Mass Index)bp: 평균 혈압 (Average Blood Pressure)s1: 혈청 (Serum) 측정치 1s2: 혈청 측정치 2s3: 혈청 측정치 3s4: 혈청 측정치 4s5: 혈청 측정치 5s6: 혈청 측정치 6Target (or Label)1년 후의 질병 진행 정도를 나타내는 정량적 측정치데이터 형태모든 feature는 standardization(표준화..
[ML] Yeast Dataset
·
Programming/ML
Yeast Dataset효모 유전자의microarray expression data와 phylogenetic profiles를 포함한multi-label classification용 데이터셋.설명각 인스턴스는 하나의 유전자(gene)을 나타내며,microarray expression data와gene의 발현 수준을 나타내는 데이터임.phylogenetic profiles를특정 유전자가 여러 생물종에서의 유무 등을 의미함.나타내는 103개의 features 로 구성됨.numerical data와symbolic data로 구성됨.하나의 유전자에 최대 14개의 biological function이 label로 할당됨.각 label은 binary value를 가짐.라벨은 physiological process,..
[ML] kNN Classifier (k-Nearest Neighbors Classifier)
·
Programming/ML
k-Nearest Neighbors (kNN) Classifier는 Supervised Learning에 기반한 non-parametric(비모수) 및 instance-based Algorithm. 이는 Label 이 지정된 data와의 distance를 이용하여 새로운 data point가 어느 class에 속하는지 예측하는 방식. 1. 기본 아이디어: 새로운 데이터가 주어졌을 때,해당 데이터와 가장 가까운 k개의 이웃 데이터 포인트 (Nearest Neighbors)를 찾고,이웃들의 Majority Voting(=hard voting) 또는 거리로 가중치를 둔 Soft Voting에 의해 새로운 데이터의 클래스를 결정.k 값은 사용자가 지정하는 hyper-parameter이며작은 k값은 과적합(ove..
[ML] Imputation
·
Programming/ML
Data Science와 ML에서 "impute"는누락된 데이터(missing data)를 대체값으로 채우는 과정을 의미이는 '대체', '귀속', 또는 '채워넣기'로 번역될 수 있음.Dataset을 다룰 때,누락된 데이터가 있는 전체 행이나 열을 제거하는 대신,imputation은 다른 가용한 features 나 선행정보(prior)를 바탕으로 missing values를 추정하여 채워넣는 방법.Imputation에서는 Training set 만을 사용하여 채워넣을 값을 구함. 주요 imputation은 다음과 같음:mean/median imputation:해당 특성의 mean이나 median으로 missing values을 대체mode(최빈값) imputation:가장 빈번한 값을 사용하여 누락된 데이..