연구/알고리즘

유사도 구하기

클러스터링을 하는데 있어서 중요한 것중의 하나는 유사도를 구하는 것이다.
데이타 간에 서로 얼마만큼의 유사도를 가지고 있는 가를 따짐으로서 클러스터링을 하게 되는데, 이러한 유사도를 구하는 방법에는 몇가지가 있다. 그  중 몇개를 살펴보면 먼저 가장 유명한 유클리안 디스턴스(Euclidean distance)측정 방식이 있다.

LaTeX equation


유클리안 디스턴스 방식은 민코스키 메트릭(Minkowski metric) 방식에서 LaTeX equation 인 특별한 경우이다.

LaTeX equation

LaTeX equation 이면 맨하탄 디스턴스(Manhattan distance) 방식이다.


다음으로는 코사인 디스턴스(cosine distance) 방식이 있다. 코사인 디스턴스는 민코스키 메트릭이 고차원(high dimentionality)의 클러스터링 데이타에서 나타날 수 있는 문제점을 해결하는 방식으로 아래와 같다.

LaTeX equation


또다른 방법으로는 마할라노비스 디스턴스(Mahalanobis distance) 방식이 있는데 이는 공분산 행렬(covariance matrix)를 이용하여 거리를 구하는 방식이다.

LaTeX equation

여기서 LaTeX equation는 공분산 행렬이다. 마할라노비스 디스턴스는 데이타의 분산(variance)과 상관(correlation)에 기반하여 다른 특성을 지닌다.

이올린에 북마크하기(0) 이올린에 추천하기(0)
top


http://www.joon.pe.kr/blog/trackback/8
Commented by ctcquatre at 2008/10/02 14:53  Reply|Edit|Delete
좋은 정보 감사드립니다.
제 블로그에 이곳원문출처를 밝히고
게제하였습니다.

좋은 하루되세요^^
Commented by djfhsvdsv at 2020/01/01 22:44  Reply|Edit|Delete
함부 하는 운동이 무의미하다는 것을 인식해야 한다.
http://xn--ij2bx6j77bo2kdi289c.zxc700.com - 블랙잭사이트
http://xn--on3b21eb4bmwh91q.zxc700.com - 바카라주소
http://xn--qn1bx5w2ifvrmbje.zxc700.com - 홀덤사이트
http://xn--299aj0wmjfoqh97o.zxc700.com - 맞고사이트
http://xn--ok0b65d1w4aujecqm.zxc700.com - 정선카지노후기
http://xn--o80bq1nhvkvsd7rhba.zxc700.com - 마카오카지노순위
http://xn--c79a67g3zy6dt4w.zxc700.com - 카지노검증사이트
http://xn--o80b67oh5az7z4wcn0j.zxc700.com - 모바일카지노
http://xn--oi2b43dh5aa317l40j.zxc700.com - 모바일바카라
http://xn--o80bz00bbzcu6f.zxc700.com - 카지노
http://xn--oi2b30ghxt.zxc700.com - 바카라
http://xn--o80b910a26eepc81il5g.zxc700.com - 카지노사이트
http://xn--oi2b30g3ueowi6mjktg.zxc700.com - 바카라사이트
http://xn--o80b27i69npibp5en0j.zxc700.com - 온라인카지노
http://xn--oi2ba146a24mbtbtvt.zxc700.com - 온라인바카라


<< Prev   1   ... 325   326   327   328   329   330   331   332   333   ... 336   Next >>