爬虫测试之无法爬取js动态生成的元素数据

cheerio模块抓取的是网页源代码(大部分的抓取数据都是这样的),因此  这里就抓取不到js动态生成的dom元素,查了很久,方法很少,大致是:

1.模拟js响应  请求url  直接获取json数据(注意:涉及到目标网站的请求验证(token,加密等)以及跨域)

2.还有一种是使用selenium   这个我也没接触过  具体就自己查吧(ps:毕竟本人也是萌新,而且我的重点不是这里,就暂时不深究啦)https://www.cnblogs.com/learnings/p/7772915.html

3.模拟浏览器发请求获取数据 ,自己构造请求头和参数,这里的请求头是重点  里面还包括cookie之内的东西 

4.使用puppeteer模块  由谷歌团队维护的  我后面的几个文章里面会用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值