正则(re.findall) 抓取script中的数据
以某网站为例(政府性质),路由地址就不发了1、网站数据如下数据是动态加载,无法使用xpath标签解析2、re.findall()抓取import reimport jsonimport requests# 获取详情页def spider_test(pageid): url = "http://xxxxxxxxxxxxx/view?id=%s" % pageid headers = { 'Cookie': 'HttpOnly; JSESSIONID=F
原创
2021-10-19 16:09:49 ·
985 阅读 ·
0 评论