clustering

    [ML] Ward’s linkage method

    정의 Ward's method는 cluster 간의 거리를 측정하는 방법 중 하나이며, centroid 와 매우 유사한 방식이지만, 각 cluster의 샘플 수에 대한 고려가 이루어진 방법이다. 간단하게 애기하면 Ward's method에서 두 클러스터의 거리는 cluster의 data points에서 centroid와의 차이를 제곱하여 더한 error sum of square가 두 cluster를 merge할 경우 얼마나 증가하는지로 나타낸다. incremental of ESS 를 이용하기 때문에 centroid linkage와 기반 논리는 비슷하지만 outlier나 noise에 보다 robust 하고 포함하고 있는 data samples 수가 비슷한 cluster들을 merge하는 경향을 보임. 수식..