推荐系统_简介

1.简介

推荐系统是一类在不同的上下文中为用户推荐“最佳”物品的计算机程序。“最佳”通常可以通过优化一些特定目标而得到,如总点击数、总收人、总销售额等。推荐系统在网络上无处不在,已经成为我们日常生活的组成部分。例如:电商网站为了最大化销售额,会向用户推荐商品;新闻网站为了最大化总点击数,会向访问的用户推荐新闻内容;视频网站为了最大化用户参与度,同时提高订阅量,会向用户推荐电影;求职网站为了最大化工作申请数,会向用户推荐工作。以上这些算法的输人通常包含与用户、物品、上下文有关的信息以及用户与物品发生交互时获取的反馈信息。
图1-1展示了一个典型的网络推荐系统示例。首先,用户通过浏览器访问某网站页面,然后浏览器向网站服务器提交 HTTP 请求。为了在页面上进行推荐(如新闻门户页面上的热门新闻报道),网站服务器会调用推荐服务,推存服务会检索出一组物品,并将其展示在网页上。这样一项推荐服务往往需要完成大量不同类型的运算才能挑选出最佳物品。这些运算通常混合了离线运算和实时运算,并且为了确保页面加载足够迅速(通常为几百毫秒),它们必须严格符合效率要求。一旦网页加载成功,用户就能与物品进行交互,如点击、喜欢或分享。从交互行为中获得的数据反过来又用于更新底层推荐算法的参数,以便为未来访问网站的用户提供更精准的推荐服务。参数更新的频率与应用有关,以新闻推荐为例,新闻报道对时间敏感,且生存期短暂,必须经常更新参数(例如每隔几分钟);而对于生存期较长的应用(如电影推荐),参数更新不频繁(如一天更新一次)也不会对系统的整体推荐效果造成太大影响。
在这里插入图片描述

                                             图1-1 典型的推荐系统

2.面向网络应用的推荐系统概述

在开发推荐系统之前,我们先考虑以下几个问题:
●可用的输入信息有哪些?在构建用于预测用户在给定的上下文中可能与哪些物品发生交互的机器学习模型时,我们可以利用很多信息,包括:每件物品的内容和来源;用户的兴趣画像(既反映了用户的历史访问数据中隐含的长期兴趣,也反映了
用户在当前会话中表现出的短期兴趣);用户已声明的信息,如人口统计信息;还有“流行度”指标,例如观测到的点击通过率(即 CTR ,表示物品被点击的次数与物品展示给用户的次数之比);以及社交分享度,如物品被转推、分享或喜欢的次数。
●可优化的目标有哪些?供网站选择的优化目标有很多,可分为短期目标和长期目
标。短期目标如点击数、收人或用户的正向显式评分;长期目标如在网站上花费的时间的延长、用户回头率和留存率的提高、社交行为的增加、订阅量的增长等。
各种不同的推荐算法便是基于以上问题的答案开发出来的。

2.1算法

通常,推荐系统中的算法需要完成以下四项任务:
内容过滤和理解。 我们需要一个高效的算法来过滤掉物品池(候选物品集)中的低质量内容。因为推荐低质量内容不仅会降低用户体验度,还会破坏网站的品牌形象。不同的应用对低质量内容的定义不同:在新闻网站中,知名出版商认为色情内容是低质量内容;电商网站不会代售信誉分过低的店家的商品。大多数情况下,确定并标记低质量内容是一项复杂的任务,需要运用一系列不同的方法才能解决,比如(编辑)打标签、众包或者分类等机器学习方法。除了过滤低质量内容之外,分析和理解质量达标的物品内容也很重要。构建能够精准捕捉内容的物品画像(如特征向量)是一种高效的方法。特征的构建可以借助词袋模型、短语提取、实体提取和主题提取等方法。
用户画像建模。 除了物品画像,我们还需要构建用户画像,它能反映用户可能会购买哪些物品。用户画像可以根据人口统计信息、用户注册时提交的身份信息、社交网络信息或用户的行为信息来构建。
评分。 有了用户画像和物品画像,接下来要设计评分函数。评分函数用来估计在给定的上下文(可能是用户正在浏览的网页、正在使用的设备或当前所处的地点)中,将一个物品展示给用户后产生的未来“价值”(如 CTR 、与用户当前目
标的语义相关性,或期望的收人)。
排序。 最后,为了最大化目标函数的期望值,我们需要一种排序机制来筛选出一个有序的推荐物品列表。最简单的无非是根据单一的分数对物品进行排序,如每件物品的 CTR 。但在实际情况中,排序比想象的更复杂,因为要综合考虑各种不同的因素,如语义相关性、量化不同效用方法的分数,或者为确保良好的用户体验的多样性要求以及为维护品牌形象而设定的商业规则。
图2-1将前面介绍的不同算法组件关联了起来。从最上面开始,将用户信息、物品信息和用户 - 物品的历史交互数据输入机器学习统计模型中,然后,模型输出用于衡量用户与物品关联度的评分。最后,排序模块结合评分和单个或多个优化目标,生成优先级从高到低排列的物品列表 。

在这里插入图片描述

                                              图2-1 推荐系统概览

2.2优化指标

2.3探索与利用之间的权衡

2.4推荐系统的评估

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值