矩阵分析与应用-10-向量的相似度

向量的相似度

考虑M个类型的模式,它们分别记作w_1,w_2,...,w_M,编号随意。假定通过已知类型属性的观测样本,业已抽取出M个样本模式向量s_1,s_2,...,s_M。给定一任意的未知模式向量x,希望判断它归属于哪一类模式。这个问题称为模式分类,它是模式识别的基本问题之一。模式分类的基本思想是将未知模式向量x同M个样本模式向量进行比对,看x与哪一个样本模式向量最相似,并据此作出模式分类的判断。

假定(x,s_1),(x,s_2),...,(x,s_M)分别作为术知模式向量x和已知样本模式向量s_1,s_2,...,s_M之间的相似关系的符号。以xs_1,s_2的相似关系为例,若

 (x,s_1)\leq(x,s_2)

则称未知模式向量x 与样本模式向量s_1更相似。

相似度(similarity)或相异度(dissirmilarity ):

最简单和最直观的相似度是两个向量之间的Euclidean距离

未知模式向量x与第主个原象模式向量s_i之间的 Euclidean距离记作D(s_i,x),定义为

 D(s_i,x) = ||x-s_i||_2=\sqrt{(x-s_i)^T(x-s_i)}

Mahalanobis距离

m=\frac{1}{N}\sum_{k=1}^Ns_i

代表N个样本模式向量的均值向量。

再令

C=\frac{1}{N}\sum_{i=1}^N(s_i-m)(s_i-m)^T

表示N个样本模式向量的协方差矩阵。

从未知模式向量x到均值向量m之间的Mahalanobis 距离定义为

D(m,x)=(x-m)^TC(x-m)

从第主个样本模式向量s_i到均值向量m的 Mahalanobis 距离定义为

D(m,s_i)=(s_i-m)^TC(s_i-m)

根据近邻分类法,将未知模式向量x归为满足

D(s_i,x)=\min |D(s_k,x)-D(m,x)|,k-1,2,..,N

的近邻s_i所属的模式类型。

 两个向量之间的相似度的测度不一定局限于距离函数。两个向量的夹角的余弦函数

S(s_i,x)=\cos (\theta_i)=\frac{x^Ts_i}{||x||_2||s_i||_2}

\cos (\theta _i) <\cos (\theta _j),\forall j \neq i成立,则认为未知模式向量x与样本模式向量s_i最相似。上式的变型

S(s_I,x)=\frac{x^Ts_i}{x^Tx+s_i^Ts_i+x^Ts_i}

称为Tanirnoto测度。

待分类的信号称为目标信号,分类通常是根据菜种物理或几何概念进行的。令X为目标信号,A_i代表第i类目标的分类概念。于是,可以有这种的关系:

(X,A_i)\leq (X,A_j),\forall i,j

这类有效关系一般用目标–概念距离(object-concept distance)D(X,A_i)描述420。因此,若日标–概念距离D(X,A_i)最小,则将X归为第i类目标C_i;。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值