到了年关,在公司空闲的时间多了一些,趁这段时间学一学推荐这个功能,不定期会更新这些博客,每篇其实都是一个坑,不一定什么时候才能填上,慎入!
背景:进入大数据时代每个网站要存的东西越来越多,商品,电影,歌曲,等等。用户的选择空间也越来越大,如何能够快速帮用户定位到喜欢的商品也成为了问题,各大网站都会有自己的推荐或猜你喜欢。
推荐大概分为两种:协作式推荐和内容相关推荐,各有好坏,或者说可以用在不同的场景。拿内容推荐来说,如果你喜欢听歌手A的歌,推荐系统慢慢会收敛于歌手A的歌,或者说喜欢挺某种风格的歌,也会使最终的推荐结果收敛于这种歌曲,而协作式推荐则会分析每个用户的相似度,为相似的用户推荐另一个用户所听的歌。而这里的相似度有物品的相似度,也有用户的相似度,相似度的计算也是件非常复杂的事情,比较显而易见的有两类,一种是欧式距离,一种是COSIN距离。
推荐大致所要做的方向就是这些,具体的实现的话哪里也找不到特别具体的方法,第一篇文章就写到这里,下一章会出现一些数学基础的部分,今天到此为止,继续研究,希望有一天能够吃透这个东西。