python文章推荐系统(项目源码+word+视频讲解)

目录

一,项目介绍

二,项目制作原理

三,项目功能

(1)登录模块

 (2)文章选择页

 (3)文章阅读

(4) 查看关键字

(5)搜索文章相识度

三,项目源码


一,项目介绍

         本项目是使用python+Tkiner组件库写的文章推荐系统,

(1)首先利用爬虫爬取新闻文章,然后保存到本地,在将爬取的数据保存都本地的myslq数据库中

(2)读取本地文章的内容,在可视化工具上显示,有三个功能分别为:查看文章内容,查看关键字,搜索与该文章类似的文章,显示文章相识度。

二,项目制作原理

        本项目通过puthon代码,从新闻网站上爬取相关数据内容保存进文本当中,并对本文里面的内容进行去除空格与去除html标签等优化处理,再将文本内容存进数据库当中。

        在将文本里面的内容进行去除数字与英文符号转为小写的处理后,采用jieba库的FMM正向最大匹配算法找到关键词,对分词结果进行词频统计进行排序,且关键字若在停用词中就不参与词频的统计,最后再判断关键词词频是否大于用户自定义的词频数,若是大于就删除更改关键字。

        在将每次文章的前n个词频度作为文章的关键字后,对所有文章的关键字都进行n维度向量,并根据向量以一个文章为模板计算文章相似度,最后利用冒泡排序将文章相似度从大到小排列。

三,项目功能

(1)登录模块

 (2)文章选择页

 (3)文章阅读

 

(4) 查看关键字

(5)搜索文章相识度

三,项目源码

        项目源码我放在了评论区里

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值