微软新闻推荐:深度学习与 NLP 的融合, 让 Windows 11“新闻与兴趣”知你所需...

猜你喜欢
0、【免费下载】2021年12月热门报告盘点1、如何搭建一套个性化推荐系统?2、快手推荐系统精排模型实践.pdf3、全民K歌推荐系统算法、架构及后台实现4、微博推荐算法实践与机器学习平台演进5、腾讯PCG推荐系统应用实践6、强化学习算法在京东广告序列推荐场景的应用7、飞猪信息流内容推荐探索8、华为项目管理培训教材9、预训练模型在华为信息流推荐中的实践

新闻推荐属于一种特殊的个性化推荐,相比于商品、电影等内容的推荐,新闻事件每时每刻都在更新,对于系统来说每条新闻都是全新的内容,这就使得系统无法获得足够的用户交互数据来训练推荐模型,因此,必须从新闻本身出发,加强对内容的理解。尽管之前也有针对新闻推荐的算法模型,但那些模型给用户推荐的往往是同质化的新闻,极易造成用户反感,难以精准匹配用户对新闻的实际需求。

微软亚洲研究院首席研究员谢幸表示,“新闻内容本身和阅读新闻的用户其实都可以用文本表示,推荐的准确与否本质上都可以看作是对这些文本语义理解的深度。过去的推荐系统要么没有使用深度学习技术,无法学习样本数据的内在规律,要么基于深度学习却没有结合自然语言处理(NLP)技术,无法对语义进行更深的理解。”因此,微软亚洲研究院将最新的深度学习与 NLP 技术集成到了对用户和新闻的建模中,大幅提升了推荐模型的性能和准确率。基于此模型,Windows 11 “新闻与兴趣”功能实现了多样化、个性化和更精准的新闻推荐,现在用户可以通过 Windows 11 中的小组件等多种方式随时看到他们最感兴趣的新闻内容。

095de6db7d9c4f79a369b2aac3713e3b.png

个性化新闻推荐的技术流程

具体来看,可以将这一推荐算法分成三层:

第一层是针对当前新闻内容本身文本的理解,实际上就是对自然语言的理解。这一层主要基于微软图灵通用语言表示模型,其核心模型和算法采用了研究院最新的统一语言预训练模型 UniLM 和多语言预训练模型 InfoXLM,这两项技术在语言理解生成和翻译任务上都取得了领先的结果。

第二层是对用户的理解,也就是围绕用户所展开的一系列文本理解,但又不只是简单的文本整合。虽然可以将用户看成一个已经浏览或阅读了新闻的文本集合,但不能将所有文本简单地进行拼接,系统还需要了解用户阅读的先后顺序,以及由此形成的用户兴趣群组、对兴趣重要性进行区分等等,这些都是对用户的建模过程。当考虑这些因素时,用户就由原来一系列标签化的表示,转变为在深度学习中的向量表示,从而极大地提升准确率。

举例来说,我们可以按照不同的属性类别给某个用户打上诸如男性、本科毕业、居住在北京等标签,这样当一条受北京男性喜爱的新闻出现时,系统就会将其推送给相关用户。然而,这种推荐方法只做了简单的匹配,因为这些标签并不能准确地描述个人特征,比如无法明确说明他真的是北京人,也不知道用户真正的兴趣爱好是什么。但深度学习则可以抛开标签,将每一个人变成数字,也就是向量,通过计算向量之间的相似性来推荐内容。

按照此方式,每个人都可以被看作是高维空间中的一个点。新闻则是同一空间中的另一个点,这样就可以直接比较用户和新闻间的距离。我们可以想象,在一个空间中同时包含了众多的用户和新闻,与其中一个用户比较近的自然就是他喜欢的新闻。

最后一层是排序。理论上可以将新闻推荐看作是对高维空间中用户与新闻内容距离的计算,但实践中还有更多的因素需要考虑,例如新闻推荐的多样性、公平性、可解释性等等。

通过将深度学习与 NLP 集成到新闻推荐系统中,Windows 11 可以更好地满足用户对新闻的需求。数据显示,在所推荐的新闻上,用户的实时点击率得到了提升,浏览时长也有所增加。

该推荐算法具有较高的通用性,涉及到个性化搜索和推荐的领域,如微软广告、必应(Bing)搜索等场景都能应用。

 
 
 
 

「 更多干货,更多收获 」

1e9ac838b0620b0142d7e409c4277546.gif

 
 

推荐系统工程师技能树

【免费下载】2021年12月份热门报告盘点

快手推荐系统精排模型实践.pdf

【干货】2021社群运营策划方案.pptx

大数据驱动的因果建模在滴滴的应用实践

联邦学习在腾讯微视广告投放中的实践如何搭建一个好的指标体系?如何打造标准化的数据治理评估体系?

【干货】小米用户画像实践.pdf(附下载链接)

推荐系统解构.pdf(附下载链接)

短视频爆粉表现指南手册.pdf(附下载链接)

推荐系统架构与算法流程详解如何搭建一套个性化推荐系统?某视频APP推荐策略详细拆解(万字长文)

关注我们

智能推荐

个性化推荐技术与产品社区

长按并识别关注

f594d2a0dfafe117a86b0adbb397994c.png

一个「在看」,一段时光👇

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值