lda新闻主题提取_关于线上新闻推荐那点事

本文解析《Semantic User Behaviour Prediction in Online News》,该文重点在于利用语义分析预测用户在线新闻行为,通过主题模型缓解数据稀疏性。文章提出将用户与多个主题映射,以主题聚类和文档主题匹配解决新闻推荐的时效性和数据稀疏性问题。推荐系统包含主题抽取、聚类、预测和推荐四个步骤,实验使用AP、MAP、PR和AR评估。尽管存在挑战,但该方法在处理数据稀疏性上优于传统协同过滤和基于内容的推荐。
摘要由CSDN通过智能技术生成

4ef6ac68d820599f4e847a4c4ebbabe4.png

《Semantic User Behaviour Prediction in Online News》的理解

这篇文章是我们团队做线上新闻推荐的主要参考文献之一,因为NTNU发布了Adressa数据集,在新闻推荐领域也算是比较前沿的了,所以对这篇文章,我们也针对性的做了了解和探讨。从标题来看,这篇文章主要是从语义角度分析用户行为并作出预测,虽然说是语义角度但实际上也就是对主题模型做了探讨和实现,并且该模型来降低数据稀疏性(毕竟用户对应文档和用户对应主题,这对应关系的数量还是有明显区别的),并且通过聚类方式来将用户和多个主题做映射关系,每个文档的最终评分与文档与主题的关系和用户与主题的关系共同得到。

新闻推荐领域是一个非常特殊的推荐领域,与电影推荐或者电商推荐所不同的是,新闻有一个非常特殊的属性——时效性,这就意味着新闻物料会有频繁的上下架操作,导致系统内的物料频繁变化,就有点像系统一直面临物品冷启动的问题。理论一点,新闻推荐存在数据稀疏性问题,这个问题包括两个方面:

  1. 用户与物品交互太少
  2. 物品的更迭频率太快

这是新闻推荐领域所面对的主要两个挑战。而本文所介绍的论文就是专注于解决这两个问题。论文提供了一种方法,通过对新上架文档的主题化、降维表示形式建模来处理这些挑战。从基于内容语义生成文本主题,并进一步通过文档主题匹配(新上架新闻和主题匹配&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值