大家好,我是一名内容型产品经理,决定写这系列的文章是因为想记录下在日常工作中遇到的问题和学习到的知识,分享给大家希望可以多多交流。
最近越来越多的产品都有需要用到推荐算法,例如资讯类产品需要为用户在首页信息流推荐内容,社区类产品也需要为用户推荐感兴趣的东西。然而算法有很多种,不过无论怎样,都会需要计算两个物品/内容间的相似度,然后再做进一步处理,本系列文章为大家介绍在实际生产环境中一些常用到的简单推荐算法~
1. 利用余弦定理公式计算物品间的相似度
- 余弦相似度原理
用向量空间中的两个向量夹角的余弦值作为衡量两个个体间差异大小的度量,值越接近1,就说明夹角角度越接近0°,也就是两个向量越相似
用向量余弦公式简化为:
公式只是次要的哈哈哈哈,最重要的是下面的推导过程,下面为大家逐步逐步剖析公式是怎么推导过来的~
- 推导过程
向量a,b,夹角为θ