目录
🐬🐬喜欢听歌的友友们,小郭子来给你们送福利啦,🌞🌞
🐬🐬接下来我们讲一讲【如何使用Python简单爬取歌曲评论】,
🐬🐬嘻嘻嘻,话不多说,直接开干。
(1)导入所需模块
from selenium import webdriver # 导入浏览器的功能
import re # 正则表达式模块, 内置
import time # 时间模块, 程序延迟
(2)创建一个浏览器对象
driver = webdriver.Chrome()
(3)执行自动化
(4)解析数据
divs = driver.find_elements_by_css_selector('.itm') # 所有div css语法: 定位到 html 数据/xpath/正则
for div in divs:
cnt = div.find_element_by_css_selector('.cnt.f-brk').text
cnt = re.findall(':(.*)', cnt)[0] # 中英文有区别
print(cnt)
(5)翻页
for page in range(10): # 控制翻页 速度太快
# 翻页 , 找到下一页标签, 点击?
driver.find_element_by_css_selector('.znxt').click()
time.sleep(1)
# selenium 欲速则不达
(6)保存为txt文件
with open('contend.txt', mode='a', encoding='utf-8') as f:
f.write(cnt + '\n')
(7)运行结果
好啦,今天的分享到这里就结束啦 ~🌞🌞
觉得我分享的文章不错的话,可以关注一下哦,嘻嘻嘻🌞🌞