前言
b站视频下的评论是下拉加载的。要想爬取所有评论,要么找到加载评论的链接寻找其规律,要么下拉到低等待页面评论全部加载。我小白一个,找不出规律,用下拉这种笨办法。
要是评论太多,下拉要好久,于是上网发现有selenium可以模拟浏览器的各种行为。这个不仅要导入模块,还要下载浏览器驱动,要配置好一会儿。
制作词云图还要停用词,网上可以下载,但还是要根据需求自己加些词。
提示:以下是本篇文章正文内容,下面案例可供参考
一、爬取b站评论
1.selenium配置
附上参考链接。如何配置selenium
2.代码
附上参考链接。用selenium爬取b站评论
上面的代码下拉只有一两次,拉不到低。我改进了一下,可以自己定下拉几次。
代码如下:
from selenium import webdriver
from time import sleep
import sys
l1=[]
av=input("请输入av号:")
from selenium.common.exceptions import NoSuchElementException #防止错误
def pa():