四十行Python代码,带你爬取热门音乐评论,制作评论词云图!

今天你抑郁了吗?
在这里插入图片描述

听歌的时候挺喜欢看评论的,特别是网抑云的,不知道各位铁汁是不是也这样,毕竟自古评论出人才,哈哈!
在这里插入图片描述

然后我就弄了个简单的代码,把评论给爬下来做了个词云图,看一下大家讨论的最多的是什么!文章看不懂的话,也有视频教程详细讲解,要看的话直接翻到文章最下面有~

福利我就不上了,怕被举报~
在这里插入图片描述
好了,我们先介绍下今天要用的软件和模块~

软件

python 3.6
pycharm

模块

re
selenium  (安装方法)python模块: pip install selneium
jieba
wordcloud
imageio

大概流程

1、selenium简单使用
2、中文分词库的使用
3、词云图的制作

先看看爬虫部分
导入浏览器的功能

from selenium import webdriver

正则表达式模块, 内置

import re

时间模块, 程序延迟

import time 

创建一个浏览器对象

driver = webdriver.Chrome()

请求页面数据

driver.get('https://music.163.com/#/song?id=569213220')  #

selenium无法直接获取到嵌套页面里面的数据
switch_to.frame() 切换到嵌套网页

driver.switch_to.frame(0)

让浏览器加载的时候, 等待渲染页面

driver
  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
制作词云图需要使用到两个库:`jieba`和`wordcloud`。 首先需要安装这两个库,可以在命令中输入以下命令进安装: ``` pip install jieba pip install wordcloud ``` 然后就可以开始编写Python代码了。假设我们要制作词云图数据来源于一个文本文件`text.txt`,以下是一个简单的代码示例: ```python import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt # 读取文本文件 with open('text.txt', 'r', encoding='utf-8') as f: text = f.read() # 使用jieba分词 words = jieba.lcut(text) # 将分词结果转换为以空格分隔的字符串 text = ' '.join(words) # 生成词云图 wc = WordCloud(background_color="white", width=1000, height=600, font_path='msyh.ttc') wc.generate(text) # 显示词云图 plt.imshow(wc) plt.axis("off") plt.show() ``` 以上代码中,`jieba.lcut`函数将文本进分词,并返回一个列表,列表中的每个元素都是一个分好的词语。`' '.join(words)`将分词后的列表转换为以空格分隔的字符串,用于生成词云图。`WordCloud`类用于生成词云图,可以设置词云图的背景颜色、宽度、高度和字体。最后调用`plt.imshow(wc)`和`plt.show()`显示词云图。 需要注意的是,由于词云图需要根据词语的频率来生成,因此在生成之前需要对文本进处理,例如去除停用词、数字、标点符号等。此外,还可以根据需求对分词结果进进一步的筛选和处理。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值