《推荐系统实践》读书笔记

搜索引擎满足了用户有明确目的时的主动查找需求。
推荐系统能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容。

80/20法则与长尾理论。

推荐方式:
社会化推荐:朋友推荐
基于内容的推荐:相同演员、导演等
基于协同过滤的推荐:热点、排行榜

推荐算法的本质是通过一定的方式将用户和物品联系起来,而不同的推荐系统利用了不同的方式。
几乎所有的推荐系统应用都是由前台的展示页面、后台的日志系统以及推荐算法系统这三部分构成的。

个性化推荐的成功应用需要两个条件。第一是存在信息过载,第二是用户大部分时候没有特别明确的需求。

电子商务
亚马逊 我们有62万用户,因此也应有62万个商店。我们应该给每个用户提供最符合他需求的商店。

电影和视频网站
Netflix

推荐系统评测
推荐系统需要满足用户的需求。
好的推荐系统设计,能够让推荐系统本身收集到高质量的用户反馈,不断完善推荐的质量,增加用户的网站的交互,提高网站的收入。
预测准确度是推荐系统领域的重要指标,没有之一。
指标包括:准确度、覆盖度、新颖度、惊喜度、信任度、透明度等。
评测推荐效果的实验方法:离线实验、用户调查和在线实验。

离线实验
步骤
1.通过日志系统获得用户行为数据,并按照一定格式生成一个标准的数据集
2.将数据集按照一定的规则分成训练集和测试集
3.在训练集上训练用户兴趣模型,在测试集上进行预测
4.通过事先定义的离线指标评测算法在测试集上的预测结果


用户调查
一方面要控制成本,另一方面又要保证结果的统计意义;需要尽量保证测试用户的分布和真实用户的分布相同,要尽量保证是双盲实验,不要让实验人员和用户事先知道测试的目标。

在线实验
切分流量是AB测试中的关键,不同的层以及控制这些层的团队需要从一个统一的地方获得自己AB测试的流量,而不同层之间的流量应该是正交的。



一个新的推荐算法最终上线,需要完成上面所说的3个实验:
首先,需要通过离线实验证明它在很多离线指标上优于现有的算法。
然后,需要通过用户调查确定它的用户满意度不低于现有的算法。
最后,通过在线的AB测试确定它在我们关心的指标上优于现有的算法。

评测维度
用户维度 主要包括用户的人口统计学信息、活跃度以及是不是新用户等
物品维度 包括物品的属性信息、流行度、平均分以及是不是新加入的物品等
时间维度 包括季节,是工作日还是周末,是白天还是晚上等。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值