推荐系统评估

如果我们只关心推荐算法这一内核,其目标就在于更好的分发系统中的内容,让每一篇内容获得展示,让每一个用户有更多的点击,评估指标可以拆分为两部分:

推荐准确度。对应到内容推荐系统中,表现为对用户点击的预判(点击率)和对消费情况(点击后的各种主动行为)的印证。由于这部分数据是可以复用既有数据进行离线计算的,故通常用于各种算法的迭代。

推荐覆盖度(多样性)。好的推荐系统是能够给用户推荐视野范围之外内容的。从用户的角度来看,可以评估用户的展示历史中各种题材、类目、话题的丰富程度是怎样的,丰富度越高代表个体体验上多样性越好。从内容的角度来看,可以评估有推荐展示的内容占整体内容量的占比,或是整个内容分发体系的基尼系数。

以Netflix为例,其站在视频被播放的角度,使用了ECS(Effective Catalog Size)指标来衡量系统推荐的多样性。如果系统内绝大多数的播放都来自同一部视频时,ECS指标接近于1;如果系统内每部视频都有相近的播放量时,ECS指标将等于影片数。如下图,对比应用了个性化推荐技术和只采用热门排序的情况,ECS相差近4倍,即系统中有更多长尾的视频都得到了有效的展示和播放。

当然,只有一部算法引擎,推荐系统这部赛车是无法正常运转的。推荐算法应当服务于整体系统的目标,比如用户端的内容消费量、长期留存、作者端的活跃度等。为了这些长线目的,会给推荐算法补充很多其他目标,这些目标可能会对短期点击率构成损伤。

指标是我们对于业务的抽象和预判印证,所以客观上它是后验性的体现。如果只关注已有指标,很容易让我们忽略了那些尚没有被纳入指标体系之内的信息。比如:如果只有全局内容分发多样性的指标而没有个体多样性指标,那么很可能出现全局内容基尼系数不高,但个体多样性体验极差的情况。又如,某些内容的点击率还不错(如蛇、野生动物捕食),但是对敏感人群构成了极大的伤害。

基于此,我们需要在数据指标的基础上,增加人工评估的环节,以帮助我们更好更快的发现潜在的问题。

援引公开博文,Facebook亦建立了一套完整的人工评估系统,分为三个部分:1-1用户访谈,面向常驻千量级外包团队的人工评估(Feed Quality panel),面向万量级普通大众的问卷。问卷表现为多种形式:

  • 给出两篇内容,让用户进行点对点的对比
  • 给单篇展示打分选项,建议用户从相关性、信息量等角度给予1-5分的评分
  • 提出开放性问题的方式来收集用户对于自己信息流的反馈。

借由人工问卷反馈,可以得到一些有趣的信息。比如,人们更愿意在信息流的头部看到那些他们愿意互动的内容或是那些更愿意打高分的信息。基于此,Facebook在排序算法中将用户的互动预估(点赞、评论)较高的内容和用户更愿意首先看到的内容进行了提权。


作者:zehuaYan

原文地址:http://www.pmcaff.com/article/index/935949966755968

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本教程为官方授权出品伴随着大数据时代的到来,作为发掘数据规律的重要手段,机器学习已经受到了越来越多的关注。而作为机器学习算法在大数据上的典型应用,推荐系统已成为各行业互联网公司营销体系中不可或缺的一部分,而且已经带来了真实可见的收益。目前,推荐系统和机器学习已经成为各大公司的发力重点,众多知名公司(如亚马逊、netflix、facebook、阿里巴巴、京东、腾讯、新浪、头条等)都在着眼于将蕴含在庞大数据中的宝藏发掘出来,懂机器学习算法的大数据工程师也成为了新时代最紧缺的人才。精心打造出了机器学习与推荐系统课程,将机器学习理论与推荐系统项目实战并重,对机器学习和推荐系统基础知识做了系统的梳理和阐述,并通过电影推荐网站的具体项目进行了实战演练,为有志于增加大数据项目经验、扩展机器学习发展方向的工程师提供更好的学习平台。本课程主要分为两部分,机器学习和推荐系统基础,与电影推荐系统项目实战。第一部分主要是机器学习和推荐系统基础理论的讲解,涉及到各种重要概念和基础算法,并对一些算法用Python做了实现;第二部分以电影网站作为业务应用场景,介绍推荐系统的开发实战。其中包括了如统计推荐、基于LFM的离线推荐、基于模型的实时推荐、基于内容的推荐等多个模块的代码实现,并与各种工具进行整合互接,构成完整的项目应用。通过理论和实际的紧密结合,可以使学员对推荐系统这一大数据应用有充分的认识和理解,在项目实战中对大数据的相关工具和知识做系统的回顾,并且可以掌握基本算法,入门机器学习这一前沿领域,为未来发展提供更多的选择,打开通向算法工程师的大门。谁适合学:1. 有一定的 Java、Scala 基础,希望了解大数据应用方向的编程人员2. 有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员3. 有较好的数学基础,希望学习机器学习和推荐系统相关算法的求职人员
如今大数据已经成了各大互联网公司工作的重点方向,而推荐系统可以说就是大数据最好的落地应用之一,已经为企业带来了可观的用户流量和销售额。特别是对于电商,好的推荐系统可以大大提升电商企业的销售业绩。国内外的知名电商,如亚马逊、淘宝、京东等公司,都在推荐系统领域投入了大量研发力量,也在大量招收相关的专业人才。打造的电商推荐系统项目,就是以经过修改的中文亚马逊电商数据集作为依托,并以某电商网站真实的业务架构作为基础来实现的,其中包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。具体实现的模块主要有:基于统计的离线推荐、基于隐语义模型的离线推荐、基于自定义模型的实时推荐,以及基于内容的、和基于Item-CF的离线相似推荐。整个项目具有很强的实操性和综合性,对已有的大数据和机器学习相关知识是一个系统性的梳理和整合,通过学习,同学们可以深入了解推荐系统在电商企业中的实际应用,可以为有志于增加大数据项目经验的开发人员、特别是对电商业务领域感兴趣的求职人员,提供更好的学习平台。适合人群:1.有一定的 Java、Scala 基础,希望了解大数据应用方向的编程人员2.有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员3.有电商领域开发经验,希望拓展电商业务场景、丰富经验的开发人员4.有较好的数学基础,希望学br习机器学习和推荐系统相关算法的求职人员

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值