[ML] Ward’s linkage method

2023. 8. 6. 11:46·Programming
728x90
728x90

정의

Ward's method는 cluster 간의 거리를 측정하는 방법 중 하나이며, centroid 와 매우 유사한 방식이지만, 각 cluster의 샘플 수에 대한 고려가 이루어진 방법이다.

 

간단하게 애기하면 Ward's method에서 두 클러스터의 거리는

  • cluster의 data points에서 centroid와의 차이를 제곱하여 더한 error sum of square가
  • 두 cluster를 merge할 경우 얼마나 증가하는지로 나타낸다. 

 

incremental of ESS 를 이용하기 때문에 centroid linkage와 기반 논리는 비슷하지만 outlier나 noise에 보다 robust 하고 포함하고 있는 data samples 수가 비슷한 cluster들을 merge하는 경향을 보임.

수식

cluster A와 B 간의 Ward distance에 대한 수식은 다음과 같음.

 

$$\begin{aligned} \text{dist}(A,B)&= \displaystyle \sum_{i\in A\cup B} \| \textbf{x}_i-\boldsymbol{\mu}_{A\cup B} \|^2 - \sum_{i\in A} \|\textbf{x}_i - \boldsymbol{\mu}_{A}\|^2 - \sum_{i\in B} \| \textbf{x}_i - \boldsymbol{\mu}_B \|^2 \\ &=\frac{n_A n_B}{n_A+n_B} \| \boldsymbol {\mu}_A - \boldsymbol{\mu}_B \|^2 \end{aligned}$$

 

  • $\textbf{x}$ : data sample vetor.
  • $n_A$ : cluster $A$ 의 data samples 갯수.
  • $n_B$ : cluster $A$ 의 data samples 갯수.
  • $n_{A\cup B}$ : cluster $A$와 cluster $B$를 merge한 경우의 해당 merged cluster의 data samples 갯수.
  • $\boldsymbol{\mu}_A$ : cluster $A$의 centroid vector.
  • $\boldsymbol{\mu}_B$ : cluster $B$의 centroid vector.
  • $\boldsymbol{\mu}_{A\cup B}$ :cluster $A$와 cluster $B$를 merge한 경우의 해당 merged cluster의 centroid vector.

'Programming' 카테고리의 다른 글

[ML] Gradient Descent Method: 경사하강법  (1) 2023.10.19
[colab] google drive와 colab연동하기 (기초)  (0) 2023.09.14
[matplotlib] bar chart 그리기 : error bar 포함  (0) 2023.08.01
[Python] for statement  (0) 2023.07.30
[PyQt6] QSizePolicy 설정.  (0) 2023.07.03
'Programming' 카테고리의 다른 글
  • [ML] Gradient Descent Method: 경사하강법
  • [colab] google drive와 colab연동하기 (기초)
  • [matplotlib] bar chart 그리기 : error bar 포함
  • [Python] for statement
dsaint31x
dsaint31x
    반응형
    250x250
  • dsaint31x
    Dsaint31's blog
    dsaint31x
  • 전체
    오늘
    어제
    • 분류 전체보기 (740)
      • Private Life (13)
      • Programming (186)
        • DIP (104)
        • ML (26)
      • Computer (119)
        • CE (53)
        • ETC (33)
        • CUDA (3)
        • Blog, Markdown, Latex (4)
        • Linux (9)
      • ... (351)
        • Signals and Systems (103)
        • Math (172)
        • Linear Algebra (33)
        • Physics (42)
        • 인성세미나 (1)
      • 정리필요. (54)
        • 의료기기의 이해 (6)
        • PET, MRI and so on. (1)
        • PET Study 2009 (1)
        • 방사선 장해방호 (4)
        • 방사선 생물학 (3)
        • 방사선 계측 (9)
        • 기타 방사능관련 (3)
        • 고시 (9)
        • 정리 (18)
      • RI (0)
      • 원자력,방사능 관련법 (2)
  • 블로그 메뉴

    • Math
    • Programming
    • SS
    • DIP
  • 링크

    • Convex Optimization For All
  • 공지사항

    • Test
    • PET Study 2009
    • 기타 방사능관련.
  • 인기 글

  • 태그

    SIGNAL
    math
    function
    Convolution
    linear algebra
    numpy
    Python
    검사
    random
    Programming
    signals_and_systems
    fourier transform
    opencv
    인허가제도
    Term
    Vector
    SS
    signal_and_system
    Probability
    Optimization
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
dsaint31x
[ML] Ward’s linkage method
상단으로

티스토리툴바