python垃圾分类源代码_震惊!垃圾分类居然能用Python搞定!

本文介绍如何利用Python在Windows环境下处理垃圾分类问题,并详细阐述了从获取B站视频弹幕到制作词云图的全过程。通过requests、beautifulsoup4、pandas等模块抓取和解析数据,然后使用wordcloud、matplotlib、jieba模块制作词云,展示了Python在数据处理和可视化方面的强大能力。
摘要由CSDN通过智能技术生成

震惊!垃圾分类居然能用Python搞定!

1 环境

操作系统:Windows

Python版本:3.7.3

2 需求分析

我们先需要通过

拿到 cid 之后,再填入下面的链接中。

http://comment.bilibili.com/{cid}.xml

打开之后,就可以看到该视频的弹幕列表。

49c6168d3852f65956d0cf40b63dadee.png

有了弹幕数据后,我们需要先将解析好,并保存在本地,方便进一步的加工处理,如制成词云图进行展示。

3 代码实现

在这里,我们获取网页的请求使用 requests 模块;解析网址借助 beautifulsoup4 模块;保存为CSV数据,这里借用 pandas 模块。因为都是第三方模块,如环境中没有可以使用 pip 进行安装。

pip install requests

pip install beautifulsoup4

pip install lxml

pip install pandas

模块安装好之后,进行导入

importrequests

frombs4importBeautifulSoup

importpandasaspd

请求、解析、保存弹幕数据

d1353ae887fd50ba819360f18a939524.png

接下来,我们就对保存好的弹幕数据进行深加工。

制作词云,我们需要用到 wordcloud 模块、matplotlib 模块、jieba 模块,同样都是第三方模块,直接用 pip 进行安装。

pip install wordcloud

pip install matplotlib

pip install jieba

模块安装好之后,进行导入,因为我们读取文件用到了 panda 模块,所以一并导入即可

我们可以自行选择一张图片,并基于此图片来生成一张定制的词云图。我们可以自定义一些词云样式,代码如下:

6df69a070a5a6af1c2c5e3ac4dfa7bd8.png

接下来,我们要读取文本信息(弹幕数据),进行分词并连接起来:

781c50ec1b30255fec6e2ce708cf4298.png

文章来源: blog.51cto.com,作者:mb5fe55c8710ded,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.51cto.com/15067249/2576205

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值