안녕하세요!

자카드, 코사인, 유클리디안, 피어슨 본문

개발일지/데이터 분석

자카드, 코사인, 유클리디안, 피어슨

shinyfood 2024. 2. 4. 22:01
728x90
반응형

추천시스템을 활용하려다보니, 코사인 유사도니, 유클리디안 거리니 잘 모르는 개념들이 나와 알아봤다.

 

자카드 유사도 : 자카드 지수는 두 집합 사이의 유사도를 측정하는 방법 중 하나이다. 자카드 계수 또는 자카드 유사도라고도 한다. 자카드 지수는 0과 1 사이의 값을 가지며, 두 집합이 동일하면 1의 값을 가지고, 공통의 원소가 하나도 없으면 0의 값을 가진다. 

 

코사인 유사도 : 코사인 유사도는 내적공간의 두 벡터간 각도의 코사인값을 이용하여 측정된 벡터간의 유사한 정도를 의미한다. 각도가 0°일 때의 코사인값은 1이며, 다른 모든 각도의 코사인값은 1보다 작다.

 

유클리디안 거리 : 유클리드 거리는 두 점 사이의 거리를 계산할 때 흔히 쓰는 방법이다. 이 거리를 사용하여 유클리드 공간을 정의할 수 있으며, 이 거리에 대응하는 노름을 유클리드 노름이라고 부른다.

 

피어슨 상관계수 : 피어슨 상관 계수는 코시-슈바르츠 부등식에 의해 +1과 -1 사이의 값을 가지며, +1은 완벽한 양의 선형 상관 관계, 0은 선형 상관 관계 없음, -1은 완벽한 음의 선형 상관 관계를 의미한다.

 

알고있던 피어슨이 그나마 눈에 띄었고, 자카드는 교집합을 사용, 코사인은 0도에서 1의값을 가지니 유사하지 않으면 축을 기준으로 나눠지고, 유클리디안 거리는 피타고라스와 비슷한 개념으로 보이는데, 3차원의 각 좌표의 거리(x2-x1, y2-y1,z2-z1으로 구한다)에 각각 제곱값을 더하고 루트를 씌우면 되는 방식.

 

728x90
반응형