유사도 구하기
클러스터링을 하는데 있어서 중요한 것중의 하나는 유사도를 구하는 것이다.
데이타 간에 서로 얼마만큼의 유사도를 가지고 있는 가를 따짐으로서 클러스터링을 하게 되는데, 이러한 유사도를 구하는 방법에는 몇가지가 있다. 그 중 몇개를 살펴보면 먼저 가장 유명한 유클리안 디스턴스(Euclidean distance)측정 방식이 있다.
유클리안 디스턴스 방식은 민코스키 메트릭(Minkowski metric) 방식에서 인 특별한 경우이다.
이면 맨하탄 디스턴스(Manhattan distance) 방식이다.
다음으로는 코사인 디스턴스(cosine distance) 방식이 있다. 코사인 디스턴스는 민코스키 메트릭이 고차원(high dimentionality)의 클러스터링 데이타에서 나타날 수 있는 문제점을 해결하는 방식으로 아래와 같다.
또다른 방법으로는 마할라노비스 디스턴스(Mahalanobis distance) 방식이 있는데 이는 공분산 행렬(covariance matrix)를 이용하여 거리를 구하는 방식이다.
여기서 는 공분산 행렬이다. 마할라노비스 디스턴스는 데이타의 분산(variance)과 상관(correlation)에 기반하여 다른 특성을 지닌다.
http://www.joon.pe.kr/blog/trackback/8
제 블로그에 이곳원문출처를 밝히고
게제하였습니다.
좋은 하루되세요^^
http://xn--ij2bx6j77bo2kdi289c.zxc700.com - 블랙잭사이트
http://xn--on3b21eb4bmwh91q.zxc700.com - 바카라주소
http://xn--qn1bx5w2ifvrmbje.zxc700.com - 홀덤사이트
http://xn--299aj0wmjfoqh97o.zxc700.com - 맞고사이트
http://xn--ok0b65d1w4aujecqm.zxc700.com - 정선카지노후기
http://xn--o80bq1nhvkvsd7rhba.zxc700.com - 마카오카지노순위
http://xn--c79a67g3zy6dt4w.zxc700.com - 카지노검증사이트
http://xn--o80b67oh5az7z4wcn0j.zxc700.com - 모바일카지노
http://xn--oi2b43dh5aa317l40j.zxc700.com - 모바일바카라
http://xn--o80bz00bbzcu6f.zxc700.com - 카지노
http://xn--oi2b30ghxt.zxc700.com - 바카라
http://xn--o80b910a26eepc81il5g.zxc700.com - 카지노사이트
http://xn--oi2b30g3ueowi6mjktg.zxc700.com - 바카라사이트
http://xn--o80b27i69npibp5en0j.zxc700.com - 온라인카지노
http://xn--oi2ba146a24mbtbtvt.zxc700.com - 온라인바카라