【1】推荐系统和搜索引擎很类似。都用到了相似性算法。
【2】主要原理是:1.基于内容的推荐 (项的相似性)2.协同过滤(两种:1、两个项相似,评级就应该相似。2、两个人口味相同,喜欢相同的项)
【3】推荐系统的任务是效用举证的填充,P239。但是我们只需要找出那些评级较高的项即可。
【4】文档profile的建立:1.通过TF-IDF选出n个词 。2.通过n的词的相似度计算出文档的相似度 。3.jaccard相似度某种情况下和余弦相似度是等家电P243,所以给你一个启示,相似度的计算方式之间并没有明显的界限。
【n】问题:
1.怎么只找那些评级较高的项呢?