Python Scrapy抓取动态网页

最新推荐文章于 2024-05-09 17:26:25 发布

LunaticZ

最新推荐文章于 2024-05-09 17:26:25 发布

阅读量794

点赞数

最近在写一个爬去亚马逊商品网站的爬虫，在此记录过程中的一些问题.
Scrapy框架不能直接爬去JS生成的动态网页，需要调用一些外来的库的方法来实现。
动态网页：
    1.交互表单。
    2.JS/AJAX。
    3.关键字。
首先对不同的方法做一个总结：
    1.逆工程（工程复杂）。
    2.浏览器渲染引擎触发JS事件。
        -WebKit
        -Selenium

Selenium对浏览器有要求，响应速度也不够快。
所以，这里主要针对对WebKit的学习。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LunaticZ

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python Scrapy抓取动态网页

最近在写一个爬去亚马逊商品网站的爬虫，在此记录过程中的一些问题.Scrapy框架不能直接爬去JS生成的动态网页，需要调用一些外来的库的方法来实现。动态网页： 1.交互表单。 2.JS/AJAX。 3.关键字。首先对不同的方法做一个总结： 1.逆工程（工程复杂）。 2.浏览器渲染引擎触发JS事件。 -WebKit -Sele
复制链接

扫一扫