神经网络 推荐

今日头条的个性化推荐是基于哪些具体数据

今日头条的slogan很清楚的告诉了我们,它的文章推荐机制是个性化推荐机制,最大化保证推送的精准度,尽量保证对的文章推荐给对的人,归根到底这个推荐算法关键是还在于对海量用户行为的数据分析与挖掘,个性化推荐的平台有很多,也许各家算法略有不同,但最终目的都是殊途同归,为实现最精准的内容推荐。

今日头条的文章个性化推荐机制主要是:相似文章主题相似性的推荐:通过获取与用户阅读过文章的相似文章来进行推荐。基于相同城市的新闻:对于拥有相同地理信息的用户,会推荐与之相匹配的城市的热门文章。

基于文章关键词的推荐:对于每篇文章,提取关键词,作为描述文章内容的一种特征。然后与用户动作历史的文章关键词进行匹配推荐。

基于站内热门文章的普适性推荐:根据站内用户阅读习惯,找出热门文章,对所有没有阅读过该文章的用户进行推荐。基于社交好友关系的阅读习惯推荐:根据用户的站外好友,获取站外好友转发评论或发表过的文章进行推荐。

基于用户长期兴趣关键词的推荐:通过比较用户短期和长期的阅读兴趣主题和关键词进行推荐。基于相似用户阅读习惯的列表推荐:计算一定时期内的用户动作相似性,进行阅读内容的交叉性推荐。

基于站点分布来源的内容推荐:通过用户阅读的文章来源分布为用户计算出20个用户喜欢的新闻来源进行推荐。麻烦请采纳,谢谢。

谷歌人工智能写作项目:神经网络伪原创

个性化推荐是什么意思?

个性化推荐,举个例子,譬如你一直喜欢在网上购买各类美食,一天当你打开某家有个性化推荐功能的网站购物时,不用搜索你就能在醒目的地方看到各类美食推荐写作猫

定制:个性化定制是在新的市场环境中企业迫切需要一种新的生产模式,它更贴近于个体的独特需求。在我国开展的个性化定制服务有个性化邮票定制、个性化高档成衣定制。

基本释义:个性化,是一类文学艺术作品中创作具体生动的人物性格的手法,也是典型化的重要方面。和大众化相对,常用来指具有个体特性的需求和服务。

个性化,对应的英语说法有:personalized,customized。个性化本来是指某事物的独特性,很少会用在人的身上。如果非要有人这样用,也无可厚非,总之是形容事物的独特性。

苹果手机个性化推荐要不要打开?

推荐模型一次输入几个用户

一个。现有的feed流推荐系统往往会采用list-wise的推荐方式,推荐模型对每一次用户请求提供一个itemlist(例如10个item)。

Lise-wise模型会综合考虑用户对这个list的整体满意度进行推荐(点击、时长、多样性等)。

这种list-wise推荐可以被建模成一个从前到后依次推荐item的序列化决策过程,而基于强化学习的模型则天然适配这种序列化决策建模,因此被广泛地应用于真实系统(如HRL-Rec、PAPERec等)。

然而,真实世界的推荐系统需要综合考虑大量特征和特征组合进行个性化推荐。随着深度神经网络的发展,更大更深的模型虽然带来了效果提升,也不可避免地带来了时间和空间复杂度的大幅提升。

这种模型大小和计算成本的提升在list-wiseRL-based推荐场景下更为明显,因为模型需要考虑整个itemlist的建模。因此,我们亟需一种高效的强化学习模型压缩方法。

为什么我们现在会掉进个性化推荐的怪圈?

首先,个性推荐系统是为了解决信息过载,通过个性化推荐提高信息分发的效率和准确性,使得用户更有粘性而被广泛使用的系统。通俗的说就是:为了让你更爽,你要什么我就给你什么。

这很美好,但这里有一个陷阱:你不要什么,我就少点给你或者不给你——你也就失去了与你意见相左的知识领域接触的机会,单一的内容被推荐多了用户也会感到疲劳。

个性化推荐用在电商领域来说应该叫“精准投放”——你想买什么淘宝就推荐给你什么,这像是双赢的感觉。

但对于内容领域(短视频等)来说,只推荐你有兴趣的内容,刺激你兴奋点的同时也让你接触世界的边界越来越窄,沉浸于自己营造的狭小的世界;难道我们进入这种回音室的怪圈之后就无法破解了吗?

推荐是用户被动的接收信息,需要用户去触发而产生的推荐结果。

例如:淘宝上用户依据价格区间的独立因素筛选商品,这种行为完全依据用户有意识的自主操作,告诉淘宝“我需要特定独立因素”的商品,淘宝后台会依据你的输入信息进而对前端的你进行反馈。

假如用户不是选一个因素,而是同时选择价了格区间+发货地区+品牌这三个独立因素时,这时后台进行筛选,把同时具备这几个独立因素的商品推荐给用户——这只是多个独立因素的简单物理标签相的加,还属于独立因素推荐的范畴。

当然淘宝真实推荐结果更为复杂,因为有商品竞价排名,这些都会影响推荐的结果,目前是举例说明。与之类似的还有网易云音乐的歌单广场。

歌单广场将歌单分为了流行、民谣、电子等不同的类别,每一个类别就是一个因素,用户选择哪个因素的标签,后台系统就更新属于该因素的歌单的数据给到前端界面上展示,这类都是独立因素的被动推荐。

网站用户需求研究:如何对用户做个性化推荐?

但通过最近一段时间的思考,有了一些新的发现和总结。个性化推荐本来是一个技术性很强的话题,但本文重点仅仅讨论推荐过程中的“道理”,不涉及任何深邃难懂的技术。

本文的讨论主要以Zite和当前几款微博过滤产品基本特征作为参照。为了避免不必要的争议,除新浪微博官方功能外,不指明其他具体产品名称。

一、基于SNS的Web阅读推荐随着近年来技术发展,如自然语言处理,数据挖掘,机器学习等领域已经形成了一批可工业化的技术,为高度个性化的内容推荐奠定了技术基础。有了加工办法,还要有原料,才能做出产品。

个性化推荐亦然。个性化推荐,无非就是将用户可能喜欢的内容挑选出来呈现给他/她。而喜欢又受两个主要因素影响:(1)内容与用户兴趣的相关程度;(2)内容本身的质量(热门度)。

换句话说,就是需要知道用户是谁?他喜欢什么样的东西?这个东西是不是用户喜欢的那些类型?

用概括性文字表述就是:用户身份标识用户的兴趣发现内容的特征识别非常庆幸,Social为个性化内容推荐提供了以上几乎所有的原料:用户有帐号标识自己;用户的兴趣可以根据他的发帖,网络关系等历史行为数据挖掘获得;内容的类型特征可以通过自然语言处理技术获得。

这一切太完美了!Zite,可以说就是这样一个生逢其时的产品,完美的将这些结合在了一起。

通过输入Twitter或者GoogleReader帐号,Zite会分析用户的阅读喜好(兴趣),然后根据用户喜好选取新闻/文章中与用户兴趣匹配度高的的结果呈现给用户,确实极大地提升了阅读的效率和质量。

二、微博信息过滤和推荐沿着上面的思路一路前行,似乎对微博这个正在趋于爆炸的信息宝库进行某种处理,根据用户的喜好进行筛选过滤,推送用户关心的内容,会是一个不错的产品形式。

但仔细思考,会发现有两个问题有待解决:1、热门度必须注意到一个现象:微博作为一种轻量级,参与度高的公开信息源。

单从条目数量上讲,微博每天的UGC数量可能比之前整个互联网一个月的产量还高,可内容却参差不齐!于是,内容的质量成了一个问题。

比如喜欢笑话的用户,推荐给他一个高质量的笑话,他会很高兴;但同样是笑话,推荐一个质量平平的笑话,可能反而是一种垃圾信息。可见,做微博信息推荐需要更加重视一个因素:内容的质量(热门度)。

基于机器学习等方法,目前自然语言处理技术在文本分类等工作的精度和效率,已经达到了工业化的标准。但对于语义方面的识别和处理,还是很不成熟的。

目前还没有任何自然语言处理技术能对一段文章的观点、文采进行质量评估。靠谱的质量评估办法,还得依靠群众对文章的反馈来获得,即热门度。

文章热门度的评估并不困难(特别对于微博),看看多少人对这条微博进行了评论和转发就可以判定它的热门程度了。

但微博作为一种实时性、瞬时性很高的SNS产品,一方面强调内容质量,一方面还有参与和粘性问题需要考虑。依赖专家型用户反馈的推荐系统,实时性必定大打折扣。

这也是为什么目前多款微博过滤、推荐产品的时序比较错乱的原因了(其中包括新浪微博官方提供的兴趣阅读功能)。这自然牺牲了不少用户感受。然而Zite这种产品形式对实时性要求不高,无须考虑这个问题。

2、用户期望高微博过滤和Zite阅读推荐还有一个差别。作为阅读推荐,只要把用户感兴趣的领域文章中,选取热门度较高的一些推送给用户,就可以很好满足用户期望。

如果漏掉了一些重要的热门新闻,或者掺杂了少量用户并不关心的内容,只要具备一定相关性,都不会明显降低用户的阅读感受。但微博就不同了。

微博用户的关注已经是用户初筛过的结果,他当然不希望漏掉这些用户的任何重要信息;另一方面,作为过滤器形式存在的产品,用户对它的无关内容过滤能力的期望也会相对比较苛刻。

综合以上两点,微博过滤器的用户满意度及格线相对比较高!3、再谈热门度除了热门度,还有一些难以具体化的因素影响着用户的喜好。

例如:很多数用户可能会有这种经历,一条转发量并不是很高的微博,却可能是我非常喜欢,非常认可的。SNS的一个重要特征是,用户的喜好很大程度上取决于用户的好友们。

用户对内容的认可程度往往依赖于他对信息源的认可程度。你不得不承认,即使都是你关注的用户,在你心中的分量是完全不同的。问题是,哪些关注是用户的最爱呢?很多时候,鞋好不好,只有脚知道。

用户通常不会主动告诉你!4、Facebook的EdgeRank算法是那颗银弹吗作为社交网络的鼻祖,Facebook同样面临信息过载的问题。它目前使用一种名叫EdgeRank的推荐算法。

从原理和工作流程上,它确实都很简单:你对好友的任何动都被称作一个edge(包括评论,转发,赞,……),根据动作的不同,你的每次动作都会被计算一个分值,所有动作的累加得分表达了你对该好友的相关程度,这个总分将会影响该好友的微博是否跟容易再你的时间线中出现。

但显然,EdgeRank更多的考虑了人与人的关系因素,而对话题因素考虑较少;对内容质量更是毫无涉及。对于关系至上的SNS,这个算法是有效的。但对于微博这种SocialMedia,他还有效吗?

5、用户细微喜好差别高度个性化的推荐,无论产品形式如何变化,最终落脚点还是对用户兴趣的深入掌握。要想对用户特征有深入的掌握,除了加强技术手段加以识别以外,充分收集用户数据也是一个非常重要的因素。

俗话说,巧妇难为无米之炊。很多很重要的用户特征,比如用户对某些细节领域的关注;或是用户对某些具体关注用户有特别的重视程度,这些从他的历史数据中并不足以得到明确的判断。

这个也增加了微博过滤的难度和复杂性。我们看看Zite是如何解决这个问题的。Zite面向篇幅较长的Web内容,用户首先看到的是文章分类和文章标题,而不是正文。用户点击标题后才进入文章开始阅读。

这个自然流程实际隐藏着一个惊天秘密—-“我对这篇文章内容感兴趣”!是的,再高明的用户兴趣识别算法也需要不断与用户磨合反馈,倾听用户的声音!

但微博过滤就不妙了,微博篇幅较短,强行增加一个点击进入的产品流程,无疑是用户体验上的自杀。那么给用户一个“Like”按钮会不会解决这个问题呢?我的答案是悲观的,用户的参与动力可能难以保证。

这个需要结合第一点(热门度)和第二点(用户期望)看,一个初始状态不能较高满足用户需求的产品,用户参与动力是很难得到保证的。用户的耐心是每个新产品推广中最昂贵的资源。

结论:为了提升用户需求的满足程度,必须具备高质量的用户兴趣识别能力;并在第一时间切实的满足用户的某项需求,至少达到及格线;最后,产品还需要具备很强的用户特征(喜好)收集能力,让你的每个试用用户,最终都能成为你产品的忠实粉丝,并以此感染他周围的人,帮助产品快速传播。

做好社会化推荐,三分技术,七分产品和运营。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值