“推荐算法”究竟是什么?

1、算法是什么?我们为何需要算法?

互联网数据中心发布的《数据时代2025》报告显示,全球每年产生的数据将从2018年的33ZB(十万亿亿字节)增长到175ZB,相当于每天产生491EB(百亿亿字节)的数据。在本质上,算法是“以数学方式或者计算机代码表达的意见”。其中,推荐系统就是一个信息过滤系统,帮助用户减少因浏览大量无效数据而造成的时间、精力浪费。

2、推荐技术发展历史上的关键事件有哪些?

“信息过载(Information Overload)”是在上个世纪80、90年代就已经存在的概念。随着信息技术和互联网的快速发展,人类从信息匮乏时代走向了信息过载时代。研究指出,早期的研究提出了通过信息检索和过滤的方式来解决这个问题。到了上世纪90年代中期,研究者开始通过预测用户对推荐的物品、内容或服务的评分,试图解决信息过载问题。推荐系统由此也作为独立研究领域出现了。

3、推荐系统有哪几个类型?

在《报告》看来,推荐系统发展至今,其核心技术可大致分为“基于协同过滤的推荐方法”、“基于内容的推荐方法”,以及“混合推荐方法”。

基于协同过滤的推荐方法,本质是根据相似的用户具有相似的喜好,推荐给他们喜欢的物品、内容或者服务。

基于内容的推荐方法:根据项的相关信息(描述信息、标签等)、用户相关信息及用户对项的操作行为(评论、收藏、点赞、观看、浏览、点击等),来构建推荐算法模型。

混合推荐方法:衡量各推荐方法的利弊,扬长避短,通过加权、切换、混杂、特征组合等方式避免或弥补各推荐技术弱点,进一步提升推荐方法性能。

4、什么是个性化推荐算法?

纵观推荐系统的发展历史,可将其大致分为非个性化推荐系统和个性化推荐系统。其中,个性化推荐系统,就是为每一个特定用户提供特定的服务,实现“千人千面”,服务个性化诉求

5、推荐算法,会导致信息窄化吗?

在外界的印象里,个性化推荐就像漏斗一样,会将推荐内容与用户相匹配,倾向于向用户推荐高度符合其偏好的内容,致使推荐的内容越来越窄化。但与外界的固有认知相反,《报告》认为在行业实践中,互联网应用(特别是位于头部的大型平台)有追求算法多样性的内在动力。在对行业内代表性应用的数据分析后,《报告》发现,阅读内容的类型数量是否够多、所阅读内容类型的分散程度是否够高,与用户是否能长期留存关联密切,呈正相关。上述两项指标对用户长期留存的作用,可以与信息的展现总量、用户的停留时长、用户阅读量等指标的影响相媲美。推荐技术并不是单纯地“投其所好”。在一些专家看来,在推荐已知的用户感兴趣内容基础上,如果能深入激发、满足用户的潜在需求,那么算法就能更好地满足人对信息的多维度诉求。

6、算法如何服务人对安全的诉求?

在人工智能技术快速发展的今天,内容安全一直是公众关注的重点。《报告》观察发现,当前很多内容创作与分发平台,从创立之初就将用户和内容安全视为最高优先级问题。以今日头条为例,在内容安全技术方面采用了鉴黄模型、谩骂模型以及低俗模型等内容识别技术。抖音安全中心则自主研发反欺诈模型、风控策略,结合抖音产品功能、内容属性、用户行为特征,对欺诈行为进行主动拦截。

7、推荐技术如何服务人对公平的诉求?

《报告》认为,推荐系统中的“公平”是站在不同角度定义问题。比如在招聘网站上,求职者方可能将公平定义为“相同的学历和能力可以被推荐类似的工作,而不受国籍、种族和性别等偏见”;对于招聘方,“公平”可能为“系统可以将他们的招聘信息推给优质的求职者,而不会因为公司的背景等因素,只将招聘信息推给不太合适的求职者”。从关注的角度出发,《报告》认为公平性可分为“用户角度”、“物品角度”这两种公平性。用户偏好放大是针对用户方(user)的公平性问题,体现为用户搜索了一样东西后,接下来一段时间的推荐都与该物品相关。流行度偏差,则通常是针对物品方(items)的公平性问题,体现为推荐系统更多推荐较为流行的物品,而不流行的物品有较少的机会被推荐或展示,造成推荐系统中的“马太效应”。当前,学界对算法公平性的研究与探讨正不断深入。麻省理工学院(MIT)在2021年发布的十大突破技术(10 Breakthrough Technologies)中指出,TikTok推荐算法能够使普通人发的内容有机会受到名人般的关注并流行起来,这是内容公平性的体现;而需求较为小众、细分的用户,也能看到符合自己兴趣的内容,则是用户角度公平性的体现。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 协同过滤推荐算法的原理是基于用户之间的相似性来推荐物品。它假设用户之间如果喜欢相似的物品,那么他们可能对未来喜欢的物品也有共同的喜好。 协同过滤有两种主要的实现方法:基于用户的协同过滤和基于物品的协同过滤。 基于用户的协同过滤算法通过计算用户之间的相似度来找到与某个用户喜欢的物品相似的其他用户,然后根据这些用户喜欢的物品来推荐物品给该用户。 基于物品的协同过滤算法则是通过计算物品之间的相似度来找到与某个物品相似的其他物品,然后根据用户喜欢的物品来推荐相似的物品。 两种实现方式基本上是对称的,唯一的区别在于它们的相似度是基于用户或物品的,而不是对两者的组合。 ### 回答2: 协同过滤是一种利用用户行为数据进行推荐的算法。它基于这样一种观点:如果一个用户在过去喜欢某些物品,并且和其他用户有相似的喜好,那么该用户可能会喜欢这些相似用户喜欢的其他物品。 协同过滤推荐算法主要分为两种类型:基于用户的协同过滤和基于物品的协同过滤。 基于用户的协同过滤算法首先构建一个用户-物品矩阵,其中行表示用户,列表示物品,每个元素表示用户对物品的评分或者行为。然后通过计算用户之间的相似度,找到和目标用户兴趣相似的其他用户。最后根据这些相似用户对未评分的物品进行推荐。 基于物品的协同过滤算法则是基于物品之间的相似度进行推荐。首先计算物品之间的相似度,然后根据目标用户已经评分过的物品,找到与之相似的其他物品,并进行推荐。 协同过滤推荐算法的关键在于相似度的计算。通常使用的相似度计算方法有:余弦相似度、皮尔逊相关系数、Jaccard相似度等。相似度的计算基于用户或物品的共同评分情况,通过比较评分的差异度量相似度。 协同过滤算法有一些优点,例如不需要事先对物品或用户进行建模,能够跨领域适用;但同时也存在一些问题,比如数据稀疏性、冷启动问题等。所以在实际应用中,通常会综合考虑不同的推荐算法来提高推荐效果。 ### 回答3: 协同过滤是一种推荐算法,其原理是基于用户的历史行为和类似用户的行为来推荐个性化的物品。 其主要分两种类型:基于用户的协同过滤和基于物品的协同过滤。 基于用户的协同过滤算法首先通过分析用户行为数据,计算出用户之间的相似度,即哪些用户有类似的喜好。然后,当一个用户需要推荐物品时,系统会找到和该用户类似的其他用户,然后将这些用户喜欢的物品推荐给该用户。 基于物品的协同过滤算法则是通过分析物品之间的相似度,即哪些物品经常被用户同时选中,来进行推荐。当用户需要推荐物品时,系统会找到用户已经购买或者喜欢的物品,然后根据这些物品的相似度,推荐给用户其他相似的物品。 协同过滤的推荐算法主要依靠用户行为数据和物品之间的相似度来进行推荐。通过分析用户的历史行为和与其他用户或物品的相似度,可以推测用户的喜好,从而向用户提供个性化的推荐。这种算法可以通过不断的迭代和优化,提高推荐的准确性和用户体验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值