起点畅销榜数据爬取-可视化大屏-动态页面【数据分析】

一之十六

已于 2024-05-16 10:31:00 修改

阅读量1.2k

点赞数 2

分类专栏：数据分析大作业文章标签：数据分析 python 爬虫

于 2023-07-08 17:40:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52164430/article/details/131614496

版权

数据分析大作业专栏收录该内容

4 篇文章

订阅专栏

在这里插入图片描述

qidian_analysis

目的

本次的数据分析项目实现了数据爬取、解析、储存、分析和可视化等需求。本项目整体使用了Python语言，爬取的目标是起点中文网，目的是获得其畅销榜单的前100部小说的相关信息（排行，书名，作者，书籍类型，简介，最新章节，最近更新时间和书籍链接），并在网页上进行相应的分析和可视化展示。

介绍

spider_qidian：将目标网站的数据进行爬取、清洗，然后保存在excel和数据库中
flask_qidian：web可视化展示
本次项目实现的大致功能：
1. 网页爬取：采用Python中的urlib库连接并且爬取了起点中文网畅销榜单，获得了需要的内容。
2. 数据解析：利用了BeautifulSoup和正则式对获取的网页内容进行了解析，拿到我们需要的信息（排行，书名，作者，书籍类型，简介，最新章节，最近更新时间和书籍链接）。
3. 数据存储：将拿到的数据保存在了Excel文件中同时也利用sqlite3库将相关的数据保存在了数据库中，以便于之后数据的利用。
4. 数据分析：利用flask框架构造了一个本地的网站，再次利用sqlite3操作数据库进行数据分析并且在网页上进行了展示。
5. 数据可视化：通过echarts对书籍类型分布情况绘制了柱状图，然后又用wordcloud完成了对书籍简介词频分析和图像的制作，同时进行了展示。

环境

python3.9 + BeautifulSoup4 +flask + 各种库

搭建/运行

数据爬取(指定起止页1~30)

在这里插入图片描述

可视化展示(运行app.py后访问终端显示的链接)

在这里插入图片描述

效果图

首页(轮播图)

在这里插入图片描述

书籍(畅销榜)

在这里插入图片描述

柱状图(类型分布)

在这里插入图片描述

词云

在这里插入图片描述

图书类型再分类分析

在这里插入图片描述

可视化大屏

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Tg2ZIwbo-1688808431047)(https://github.com/Mingdaj/qidian-analysis/assets/130920375/5c9116e8-8d77-49d3-b895-0b925c47d640)]

项目详情 https://github.com/yizhishiliu/qidian-analysis

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。