今天你抑郁了吗?
听歌的时候挺喜欢看评论的,特别是网抑云的,不知道各位铁汁是不是也这样,毕竟自古评论出人才,哈哈!
然后我就弄了个简单的代码,把评论给爬下来做了个词云图,看一下大家讨论的最多的是什么!文章看不懂的话,也有视频教程详细讲解,要看的话直接翻到文章最下面有~
福利我就不上了,怕被举报~
好了,我们先介绍下今天要用的软件和模块~
软件
python 3.6
pycharm
模块
re
selenium (安装方法)python模块: pip install selneium
jieba
wordcloud
imageio
大概流程
1、selenium简单使用
2、中文分词库的使用
3、词云图的制作
先看看爬虫部分
导入浏览器的功能
from selenium import webdriver
正则表达式模块, 内置
import re
时间模块, 程序延迟
import time
创建一个浏览器对象
driver = webdriver.Chrome()
请求页面数据
driver.get('https://music.163.com/#/song?id=569213220') #
selenium无法直接获取到嵌套页面里面的数据
switch_to.frame() 切换到嵌套网页
driver.switch_to.frame(0)
让浏览器加载的时候, 等待渲染页面
driver