연구/알고리즘

k-means clustering

K-means 알고리즘은 간단하고, 직접적이다. K-means 알고리즘을 요약하면,

1단계. random하게 cluster centroid를 선택한다.

2단계. 각 vector들을 가장 가까운 cluster centroid에 연결한다.

3단계. 각 vector들과 cluster centroid 사이의 값을 전부 더한 후 평균을 낸다. 식으로 나타내면 다음과 같다. LaTeX equation

4단계. 3단계에서 나온 결과로 cluster centroid 갱신한다.

5단계. 2~4단계를 특정 임계값이 만족할 때까지 반복한다.

K-means 알고리즘이 주된 결점은 결과가 초기 cluster centroid에 너무 sensitive 하다는 것과 local optima에 빠진다는 것이다.

관련링크
http://fconyx.ncifcrf.gov/~lukeb/kmeans.html
http://fconyx.ncifcrf.gov/~lukeb/kmeanout.html
http://fconyx.ncifcrf.gov/~lukeb/clusdis.html

이올린에 북마크하기(0) 이올린에 추천하기(0)
top


http://www.joon.pe.kr/blog/trackback/145


<< Prev   1   ... 196   197   198   199   200   201   202   203   204   ... 336   Next >>