基于内容的新闻推荐系统 项目源码、数据库、开发文档PPT

基于内容的新闻推荐系统
[红旗]技术栈:Java EE、Eclipse、Mysql-5.6、Spring、SpringMVC、Mybatis、JavaScript、EasyUI、TF-IDF算法、余弦相似度算法
[hot]项目包括:项目源码、数据库、开发文档PPT、运行须知等
[火]包运行、配运行环境、问题等
[钉子]推荐算法:基于内容推荐算法:TF-IDF、余弦相似度
[1]基本原理:根据用户的浏览行为,获得用户的兴趣偏好度,为用户推荐跟他的兴趣偏好相似的内容,采用词频-逆文档词频来提取文章关键字,根据关键词词频向量计算相似度(余弦相似度)来进行内容推荐。
(1)方法描述
在新闻领域,推荐系统将用户的特征作为依据,利用用户历史行为数据进而挖掘用户可能需要的文章内容并推送给用户,以减少用户在新闻搜索上花费的时间和精力。
系统首先使用分词工具包jieba对每个新闻进行分词,根据分出来的值过滤掉语气词和不重要的内容,然后计算每个词的TF-IDF值获取新闻关键词以及采用余弦相似度计算除自己以外的其他新闻关键词的相似度,根据从大到小排序,选取前五个新闻的id保存在相似度列表中,当用户通过点击一个新闻的标题、封面等查看新闻详情页时,系统就会去数据库取该新闻相似度最高的5条新闻然后把它们推荐给用户。
(2)内容相似
新闻作为文本类的数据,可以从文本特征几个方面去提取它的特征信息,然后将不同的新闻间的特征信息进行比较。
通过采用余弦相似度比较特征信息,计算的余弦值越接近1就越相似。
(3)提取新闻关键词
TF-IDF的主要思想是:如果一个字词在一篇文档中出现的次数很多,而在语料库其他文档中出现的

  • 9
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值