基于邻域的推荐算法是一种常用的推荐算法,而基于用户特征的的邻域推荐算法是一种重要的邻域推荐算法。
用户A购买了商品B,或者对B做了流量评价等,可以用B表示为A的一个特征,这样每个用户就有多个特征,通过计算用户特征来得到用户的相似性。如果每个特征都赋值相同的权重,效果并不会很好。可以借鉴搜索引擎里面的tf/idf,对于大量被购买的商品,可以赋值较小的权重。
其实可以把用户看成是一篇文档,而用户购买的商品看做是文档的特征,计算用户的相似性就是计算文档的相似性。所有文本挖掘的方法都可以用在个性化推荐上面了。