深度学习理论方法 —— 相似度计算

基于欧几里得距离的相似度计算

【公式1】:欧几里得计算公式

d=\sqrt{\left(x_{1}-x_{2}\right)^{2}+\left(y_{1}-y_{2}\right)^{2}}

作为计算结果的欧式值显示的是两点之间的直线距离,该值的大小表示两个物品或者用户差异性的大小,即用户的相似性如何。如果两个物品或者用户距离越大,那么相似性越小;反之,距离越小相似度越大。由于欧几里得相似度计算中最终数值的大小和相似度成反比,因此在实际中常常使用欧几里得距离的倒数作为相似度值,即1/d+1作为近似值。

【例子1】:欧几里得公式的应用

 物品1(特征1)物品2(特征2)物品3(特征3)物品4(特征4)
用户11131
用户21232
用户32211

如果计算用户1和其他用户之间的相似度,通过欧几里得距离公式可以得出:

d_{12}=\sqrt{(1-1)^{2}+(1-2)^{2}+(3-3)^{2}+(1-2)^{2}} \approx 1.414

从结果可知,用户1和用户2的相似度为1.414。用户1和用户3的相似度是:

d_{13}=\sqrt{(1-2)^{2}+(1-2)^{2}+(3-1)^{2}+(1-1)^{2}} \approx 2.287

因此可以得到用户2更加相似于用户1(距离越小,相似度越大)

 

基于余弦角度的相似度计算

【公式2】:余弦相似度计算公式

\cos @=\frac{\sum\left(x_{i} \times y_{i}\right)}{\sqrt{\sum x_{i}^{2}} \times \sqrt{\sum y_{i}^{2}}}

两条直线分别从坐标原点出发,引出一定的角度。如果两目标较为相似,那么其线段形成的夹角较小。因此在使用余弦度量的相似度计算中可以用夹角的大小来反映目标之间的相似性。

余弦值一般为[-1,1],这个值的大小与余弦夹角的大小成正比。夹角越小,余弦值越小,两目标越相似。

【例子2】:余弦相似度公式的应用

表1中用户1和用户2之间的相似性,结果如下:

d_{12}=\frac{1 \times 1+1 \times 2+3 \times 3+1 \times 2}{\sqrt{1^{2}+1^{2}+3^{2}+1^{2}} \times \sqrt{1^{2}+2^{2}+3^{2}+2^{2}}}=\frac{14}{\sqrt{12} \times \sqrt{18}} \approx 0.789

用户1和用户3的相似性如下:

d_{13}=\frac{1 \times 2+1 \times 2+3 \times 1+1 \times 1}{\sqrt{1^{2}+1^{2}+3^{2}+1^{2}} \times \sqrt{2^{2}+2^{2}+1^{2}+1^{2}}}=\frac{8}{\sqrt{12} \times \sqrt{10}} \approx 0.344

相对于用户3,用户2与用户1更为相似。

 

对比

欧几里得相似度注重目标之间的差异,与目标在空间的位置直接相关。

余弦相似度是不同目标在空间中的夹角,更加表现在前进的趋势上的差异。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值