关闭

余弦定理----相似性计算

标签: 数学计算机相似度计算
607人阅读 评论(0) 收藏 举报
分类:

在向量中,余弦定理为

 cos(x) = <a,b> / |a||b|


通常用这个来进行相似度计算但这里计算的前提是a,b两个向量空间维数要对齐,(通常操作都是进行归一化,例如两个不一致时要维数小的向大的看齐)

由于夹角越小表现为两个向量越接近重合(也就是越相似),表现到这个公式上就是cos(x)得到的值较大;


所以通常用这个余弦定理来进行相似度计算



句1:  我是中国的学生

句2:  我来自于中国的北京


则进行相似度计算前需要完成以下几步。

1,转化为向量

2,向量对齐


总体词汇 切分为:{我, 中国,学生,来自于,北京}

则句1:   

1, 1, 1 ,0 , 0

句2:

1, 1 , 0 , 1 , 1

这样可以用cos(x)进行求值,这个值就是两个句子的相似度





0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:431835次
    • 积分:4471
    • 等级:
    • 排名:第6630名
    • 原创:64篇
    • 转载:0篇
    • 译文:0篇
    • 评论:7条
    说明
    分享点滴