基于内容推荐:
协同过滤:根据朋友的意见
Tf idf
TF:某个单词在一篇文档中出现的频率
IDF:该单词在其他文档中是不是出现,分子:所有文档的个数,分母:包含这个特定搜索词的文档的个数.比如the 分子分母比接近一,取log就为0
向量空间模型
缺点:不能识别近义词和多义词
隐含语义分析
点与原点的连线夹角越小关系越近
pagerank
有多少别的网页指向它以及其他网页的含金量
所有网页的pagerank值无论哪一时刻加起来一定等于一
协同过滤:
计算两个用户的相似度,用一个用户的打分预测另一个用户打分
ra是a这个用户对所有商品打分的平均分
按列算商品与商品之间的相关性
modelbased cf