最小距离法是分类方法中最简单的方法之一
当想要判断一个新的样本向量的类别的时候,就去计算它与各类别的代表向量的距离即可
求每一类的代表向量
设一个样本集有
p
类样本
设第
其代表向量一般为这些样本的均值向量,即
ωim=1k(ωi1+ωi2+...+ωik)
计算距离
设需判断的样本为 ω ,则接下来需要计算出p个距离出来,然后比较出哪个距离最小,就把该样本判定为距离最近的那一类
d1=d(ω,ω1m)
d2=d(ω,ω2m)
…
dp=d(ω,ωpm)
然后看 min{d1,d2,...,dp} 属于哪一类
几种距离
至于两个向量的距离的计算,有好几种,最常见的是欧氏距离
比如,若求 ω1 和 ω2 的距离
设 ω1 为 (x1,x2...xn) ,是个n维向量
设 ω2 为 (y1,y2...yn) ,是个n维向量
欧氏距离= ∑k=1n(xk−yk)2−−−−−−−−−−−√ = (ω1−ω2)(ω1−ω2)T−−−−−−−−−−−−−−−−√ ,这里 ω 是个行向量
曼哈顿距离= ∑k=1n|xk−yk|
闵可夫斯基距离= ∑k=1n(xk−yk)r−−−−−−−−−−−√r
欧氏距离和曼哈顿距离是闵可夫斯基距离的特例。表示r=2和r=1的时候的特例。