概述
无监督的学习方式
相近的归类–分类具有一定意义:无监督学习
关键:
- 亲疏关系:相似性与距离
- 分类数确定:分多少类合适
距离的度量:
欧几里得距离:两个点坐标距离:
曼哈顿距离:绝对轴距总和:
切比雪夫距离:各坐标数值差的最大值
明可夫斯基距离:多个距离公式的概括性表述
dist(x)
a b
b 10.392305
c 2.828427 10.770330
ac距离更短
相似性度量
余弦相似性的度量:
更注重在方向上的差异
cos θ = ∑ 1 n ( A i × B i ) ∑ 1 n A i 2 × ∑ 1 n B i 2 \cos\theta=\frac{\sum_1^n(A_i\times B_i)}{\sqrt {\sum_1^nA_i^2} \times \sqrt{\sum_1^nB_i^2}} cosθ=∑1nAi2×∑1nB