lda新闻主题提取_关于线上新闻推荐那点事

最新推荐文章于 2022-03-17 22:10:39 发布

weixin_39939276

最新推荐文章于 2022-03-17 22:10:39 发布

阅读量283

点赞数

文章标签： lda新闻主题提取

本文链接：https://blog.csdn.net/weixin_39939276/article/details/111646350

版权

本文解析《Semantic User Behaviour Prediction in Online News》，该文重点在于利用语义分析预测用户在线新闻行为，通过主题模型缓解数据稀疏性。文章提出将用户与多个主题映射，以主题聚类和文档主题匹配解决新闻推荐的时效性和数据稀疏性问题。推荐系统包含主题抽取、聚类、预测和推荐四个步骤，实验使用AP、MAP、PR和AR评估。尽管存在挑战，但该方法在处理数据稀疏性上优于传统协同过滤和基于内容的推荐。

摘要由CSDN通过智能技术生成

《Semantic User Behaviour Prediction in Online News》的理解

这篇文章是我们团队做线上新闻推荐的主要参考文献之一，因为NTNU发布了Adressa数据集，在新闻推荐领域也算是比较前沿的了，所以对这篇文章，我们也针对性的做了了解和探讨。从标题来看，这篇文章主要是从语义角度分析用户行为并作出预测，虽然说是语义角度但实际上也就是对主题模型做了探讨和实现，并且该模型来降低数据稀疏性（毕竟用户对应文档和用户对应主题，这对应关系的数量还是有明显区别的），并且通过聚类方式来将用户和多个主题做映射关系，每个文档的最终评分与文档与主题的关系和用户与主题的关系共同得到。

新闻推荐领域是一个非常特殊的推荐领域，与电影推荐或者电商推荐所不同的是，新闻有一个非常特殊的属性——时效性，这就意味着新闻物料会有频繁的上下架操作，导致系统内的物料频繁变化，就有点像系统一直面临物品冷启动的问题。理论一点，新闻推荐存在数据稀疏性问题，这个问题包括两个方面：