查找网页中关键字参数
首先查找网页中需要获取的关键字参数,网页具体信息通过右击选择查看源代码可以得到。
程序设计
设计获取关键字的函数
def parse_page_read(html):
try:
read_num = int(re.compile('content.*?播放量 .*?(\d+).*?').search(html).group(1))
return read_num
except Exception:
print('解析出错')
return None
如果想要更换读取数据的类型 可对parse_page_read()函数进行修改
防止触发反爬机制
由于过于频繁查看数据可能会导致反爬机制,因此可以设置访问的时间间隔。
sleep_time = random.randint(60, 70)
print('please wait', sleep_time, 's')
time.sleep(sleep_time)
总体程序
htt去掉去掉ps://w去掉去掉ww.bil去掉去掉ibili.com/re去掉去掉ad/cv2148去掉去掉5334?spm_id_from=333.9去掉去掉99.0.0