解决信息过载问题,代表性方案:
1)分类目录(雅虎):互联网规模变大,分类目录网站只涵盖少量热点。
2)搜索引擎(谷歌):用户无法找到准确描述自己需求的关键字。
推荐系统:不需要搜索引擎,根据用户历史行为给用户兴趣建模,主动给用户推荐符合用户需求的信息。联系用户和信息。实现消费者和信息生产者的双赢。
80/20原则:80%的销售额来自20%的热门产品。
个性化推荐系统需要解决的主要问题:研究用户兴趣,发掘长尾提高销售量。
推荐系统常用的三种联系用户和物品的方式:朋友(基于社会化的推荐)、历史兴趣(基于内容的推荐)、用户的注册信息(找到和自己兴趣相同的一群用户,基于协同过滤的推荐)。
推荐系统由 前面的展示页面、后台的日志系统、推荐算法组成。
基于邻域的算法分为:基于用户的协同过滤、基于物品的协同过滤。
基于用户的协同过滤:推荐算法中最古老的算法1)找到和目标用户兴趣相似的用户集合(余弦相似度)2)找到这个集合中用户喜欢且目标用户没有听过的物品推荐给目标用户。
基于物品的协同过滤:目前业界应用最多的算法。1)计算物品之间的相似度2)根据物品相似度和用户的历史行为给用户生成推荐列表。
userCF:需要更新新用户相似表推荐结果着重于反应和用户兴趣相似的小群体的热点。(偏向社会化),适合于新闻推荐。新闻更新快,用ItemCF会有大量的物品表需要更新。适用于用户少的情况,时效