Python - 使用距离度量 (Lr-norm、余弦、Jaccard 和 Hamming距离)

以下内容来自《Python数据科学指南》

欧式空间与非欧氏空间的区别:

直观理解上:如果向量的元素是实数,那就是欧式空间;如果是整数,则不是欧式空间。其中文本挖掘时,词被当作轴,文档作为空间内的向量,两个文档向量的夹角的余弦值代表这两个文档之间的相似度。

数学理解上:欧式空间内两条平行线永不相交。但如果把空间想做一个地球,其中作为平行线的经线会相交于极点,此时该空间为非欧氏空间。
参考链接:https://www.zhihu.com/question/27903807如何通俗的解释欧氏空间?

 

欧式空间的距离度量:

Lr-Norm距离:当r为2时,该距离度量为euclidean_distance,欧式距离也称L2-Norm距离。

余弦距离:即两个输入向量间夹角的余弦值。

 

非欧式空间的距离度量

Jaccard距离:用于测量集合间的距离,交集大小/并集大小=Jaccard系数,1- Jaccard系数为其距离。

Hamming距离:统计不同的位的总数。

 

调用的API:

from sklearn.merics import euclidean_distances等


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值