安装和使用pyv8解析JavaScript

最新推荐文章于 2024-05-24 09:59:45 发布

半吊子Py全栈工程师

最新推荐文章于 2024-05-24 09:59:45 发布

阅读量7.4k

点赞数 1

分类专栏：爬虫 python各种库的安装文章标签：爬虫 python3 pyv8 安装使用

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26877377/article/details/79734969

版权

在遇到JavaScript渲染的网页时，常规爬虫无法获取数据。本文介绍了三种解决方法，重点讲解如何使用PyV8库进行JavaScript执行，以获取所需数据。首先安装Boost和PyV8依赖，如果安装失败则手动下载并放置到指定位置，接着通过Python代码测试PyV8是否安装成功。最后，提醒大多数网站的反爬策略并非如此严格。

摘要由CSDN通过智能技术生成

最近爬取某网站，发现整个网页都是JavaScript渲染生成的！！！而且我需要的数据不是通过ajax或jsonp来获取的，也就没有清晰易读的json文件给我们，此时使用正常的爬取手段已经不能实现数据的爬取了

这里我想到3个办法来完成爬取，

第一种是使用selenium模拟登陆（必须在登陆以后才能查看数据），同时需要使用代理池和很多账号，速度不快，但是能慢慢跑。

第二种是分析6万行js代码！！！找到它是怎么获取数据的！！！然后在爬取。。。。。这种方法直接pass

第三种是使用pyv8这个库来进行JavaScript代码运行，然后获取需要的数据，下面介绍pyv8的安装

安装依赖

最低0.47元/天解锁文章

半吊子Py全栈工程师

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。