谷歌爬虫神器（Pyppeteer）--神挡杀神，佛挡杀佛

最新推荐文章于 2023-08-19 01:48:54 发布

大前端工程师

最新推荐文章于 2023-08-19 01:48:54 发布

阅读量645

点赞数

分类专栏： Python 文章标签： python

程麒阁-大连大学-软件工程学院

本文链接：https://blog.csdn.net/chengqige/article/details/107356979

版权

Python 专栏收录该内容

10 篇文章 2 订阅

订阅专栏

你遇到的问题

我们可能用requests保存的网页，返回到的都是JS代码，那我怎么解析网页，Xpath和BS4都是筛选HTML标签的呀。这咋办？这说明人家是JS预加载，那些网站这样做是为了反爬虫
如果是之前我们肯能要分析JS代码找到里面的JSON数据，转换JSON格式化，然后再抓数据
可是现在谷歌推出一款神器，神挡杀神，佛当杀佛
无论对方怎么JS加载，用这个神器总是会返回HTML代码
然后呢？你就解析就好了，用Xpath或BS4解析
这不就是进入小白知识范畴了麻
小白说：有这个我来我也行呀

神器文档

谷歌神器：Pyppeteer
官方文档：Pyppeteer

大前端工程师

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
谷歌爬虫神器（Pyppeteer）--神挡杀神，佛挡杀佛

你遇到的问题我们可能用requests保存的网页，返回到的都是JS代码，那我怎么解析网页，Xpath和BS4都是筛选HTML标签的呀。这咋办？这说明人家是JS预加载，那些网站这样做是为了反爬虫如果是之前我们肯能要分析JS代码找到里面的JSON数据，转换JSON格式化，然后再抓数据可是现在谷歌推出一款神器，神挡杀神，佛当杀佛无论对方怎么JS加载，用这个神器总是会返回HTML代码然后呢？你就解析就好了，用Xpath或BS4解析这不就是进入小白知识范畴了麻小白说：有这个我来我也行呀神器文档谷歌神
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。