python爬虫之动态HTML、Selenium详解、Selenium3.141+PhantomJS / chrome / firefox66+webdriver / gecodriver配置问题全解

本文介绍了如何处理动态HTML,探讨了Selenium与PhantomJS的使用,特别讲解了Selenium与Firefox+geckodriver的配置,包括下载、安装和环境变量配置。此外,还提到了Selenium操作网页元素的方法,如模拟点击、输入等。
摘要由CSDN通过智能技术生成

动态HTML

1、爬虫与反爬虫

俱进~

2、动态HTML介绍

-JavaScript

-jQuery

-Ajax

-DHTML

-Python采集动态数据

        -从Javascript代码入手采集

        -Python第三方库运行JavaScript,直接采集在浏览器看到的页面

3、Selenium + PhantomJS

(1)Selenium:WEB自动化测试工具

        -自动加载页面

        -获取数据

        -截屏

        -安装:pip install selenium==2.48.0(或者其他版本,直接用pycharm里的settings装也行)

        -官网:http://selenium-python.readthedocs.io/index.html

                    https://selenium-python.readthedocs.io/installation.html

        -官方说明文档:https://www.seleniumhq.org/docs/index.jsp

 

(2)PhantomJS(幽灵浏览器)

现在已经宣告退出了,以后用其他的吧,谷歌、火狐都行,具体安装配置往下看

        -基于Webkit的无界面的浏览器(爬下来并执行代码)

        -官网:http://phantomjs.org/download.html

 

(3)Seleni

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值