基于PythonGUI实现的Bangumi动画评分处理

shejizuopin

已于 2022-07-14 14:27:41 修改

阅读量591

点赞数 1

文章标签：动画 python GUI 动画评分处理 Bangumi动画评分处理

于 2022-07-14 14:24:59 首次发布

本文链接：https://blog.csdn.net/sheziqiong/article/details/125783549

版权

本文介绍了作者如何通过Python爬虫技术，从权威动画评分平台Bangumi抓取数据，分析动画发展、观看趋势、相似推荐及用户搜索，使用Pyecharts和Pyqt5实现可视化，并分享了关键技术和数据处理过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

资源下载地址：https://download.csdn.net/download/sheziqiong/86165317
资源下载地址：https://download.csdn.net/download/sheziqiong/86165317

在本次Python大作业中，我主要是针对四个问题进行了分析与研究。分别是：

动画片在近年来的发展现状。
了解动画片具体讲述的主题，统计动画片在当季播出之后的观看情况
根据一部看过的动画片，分析与该动画片最相似的动画片。
根据用户所输入的动画片，搜索出对应动画片的相关信息

对于这四个问题，我大体上均采用了从网站上爬取数据->对数据进行清洗处理->对清洗后的数据进行可视化分析这样的方式进行解决。我选择用来获取的网站是国内最为权威的动画评分平台之一：Bangumi，在Bangumi上获得的数据相比其他平台更为真实准确，适合用来进行数据分析。针对本题的可视化需求，我使用了Pyecharts库，用于v1版本的使用较为复杂，故选择了0.5.11版本对数据进行可视化。对于数据的爬取上，我使用了requests库进行爬取，并采用re库和bs4库对所需要的数据进行提取。在爬取时我使用了自己电脑所在浏览器的header进行模拟，以便于爬取能够准确进行。对于数据的集中处理统计，我是用的是pandas库，进行一系列操作。针对评论区中部分出现乱码的问题，我采用了xlsxwriter库中的方法，将评论区顺利保存入xlsx文件中。对于具体动画评论区的评论分析，我采用了jieba,wordcloud,matplotlib和imageio库，对评论区的评论先进行中文的分词，并导入停用字表，删除评论中一些错误的分词，使得分词结果更加精确。对于每一部分所爬取的数据，我均已xlsx格式存储在本地，每一部分可视化操作得到的图表也均已html格式存储在本地。

对于最终结果的展示，我使用了Pyqt5这一GUI库制作出GUI，来展示每一题最终数据分析后得到的结果。下面对具体每一个问题的处理方法分别进行介绍：

在这里插入图片描述