毕业设计基于Scrapy开发新闻智能分类微信小程序

最新推荐文章于 2024-10-02 21:41:24 发布

m0_71572237

最新推荐文章于 2024-10-02 21:41:24 发布

阅读量96

点赞数 1

文章标签：课程设计 scrapy 微信小程序毕业设计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_71572237/article/details/142685507

版权

文章目录

0 项目说明
1 项目介绍
2 技术栈
3 系统架构图
4 实现步骤
- 4.1 数据爬取
- 4.2 文本分类
5 效果演示
- 5.1 小程序首页
- 5.2 小程序工具页
6 项目工程

0 项目说明

基于Scrapy开发新闻智能分类微信小程序

提示：适合用于课程设计或毕业设计，工作量达标，源码开放

1 项目介绍

该项目是我的毕业设计，是一个文本分类相关的应用，目的是打造出一个可以对新闻进行智能分类的微信小程序。

2 技术栈

Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序，涉及爬虫、文本分类、Web 开发和微信小程序。

3 系统架构图

系统架构图如下图所示，分为基础设施层、服务层、交互层、应用层。

4 实现步骤

整个系统的实现分为如下四个步骤，分别是新闻数据爬取、文本分类处理、后端 API 接口开发，微信小程序客户端构建。

4.1 数据爬取

爬虫的目标网站为中国新闻网，新闻数据爬取分类为：国内、国际、军事、体育、社会、娱乐、财经，爬取新闻的时间跨度为 2012 年到 2019 年。

4.2 文本分类

文本分类的效果如下图所示，橙色和蓝色的数量约接近，代表这个分类下的新闻机器分类正确率越高，可以看到由于上面军事类新闻的数量较少，所以训练出来的新闻分类模型效果不是很高，错误率较高。

5 效果演示

5.1 小程序首页

小程序首页展示新闻列表，点击新闻条目可以查看新闻详情，可以点击分类按钮选择新闻分类，还可以输入关键字查找新闻。

5.2 小程序工具页

6 项目工程

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。