Python(9):利用selenium操作网页并抓取内容

因为项目原因,需要获取中国所有铁路线路及车次信息,但是并没有任何网站或文章直接将所有信息整合在一起提供出来,因此只能自己从页面上扒。

这里利用到了python的selenium模块,自动定位操作网页,然后通过其他方式获取页面信息,以达到数据搜索整合的目的。

我使用的是pycharm工具作为环境运行代码的,直接在setting中安装就可以,各位也可以用pip命令安装,很方便,这里不赘述

安装过后需要chrome浏览器的支持,尤其需要chromedriver驱动,否则无法进行网页的打开以及自动操作

关于chrome和chromedriver的安装不是本文重点,有不理解的小伙伴可以百度搜索安装一下

 

这里是一个简单的小例子,也是网上可以搜到的,需要了解的是里面的操作

from selenium import webdriver
from time import sleep


if __name__ == '__main__':

    driver = webdriver.Chrome()
    driver.get("http://www.baidu.com")
    driver.maximize_window()
    driver.find_element_by_id("kw").send_keys("Python")
    sleep(3)
    driver.find_element_by_id("su").click()
    # driver.quit()

第一步指定chrom浏览器

第二步设置网址

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值