目录
一,项目介绍
本项目是使用python+Tkiner组件库写的文章推荐系统,
(1)首先利用爬虫爬取新闻文章,然后保存到本地,在将爬取的数据保存都本地的myslq数据库中
(2)读取本地文章的内容,在可视化工具上显示,有三个功能分别为:查看文章内容,查看关键字,搜索与该文章类似的文章,显示文章相识度。
二,项目制作原理
本项目通过puthon代码,从新闻网站上爬取相关数据内容保存进文本当中,并对本文里面的内容进行去除空格与去除html标签等优化处理,再将文本内容存进数据库当中。
在将文本里面的内容进行去除数字与英文符号转为小写的处理后,采用jieba库的FMM正向最大匹配算法找到关键词,对分词结果进行词频统计进行排序,且关键字若在停用词中就不参与词频的统计,最后再判断关键词词频是否大于用户自定义的词频数,若是大于就删除更改关键字。
在将每次文章的前n个词频度作为文章的关键字后,对所有文章的关键字都进行n维度向量,并根据向量以一个文章为模板计算文章相似度,最后利用冒泡排序将文章相似度从大到小排列。
三,项目功能
(1)登录模块
(2)文章选择页
(3)文章阅读
(4) 查看关键字
(5)搜索文章相识度
三,项目源码
项目源码我放在了评论区里