Python(9):利用selenium操作网页并抓取内容

Just_like_fire

于 2019-04-04 15:41:23 发布

阅读量4.8k

点赞数 2

分类专栏： python 文章标签： python selenium 网页操作网页抓取

本文链接：https://blog.csdn.net/Leo_csdn_/article/details/89018925

版权

本文介绍了如何使用Python的selenium模块进行网页操作和内容抓取，以获取中国铁路线路及车次信息。通过在Pycharm环境中安装selenium，配合chrome浏览器和chromedriver，实现对网页的自动化控制。示例代码展示了自动搜索列车车次、站点和时间信息的过程，关键步骤包括定位网页元素和触发相应操作，强调了不同页面元素id的查找方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

因为项目原因，需要获取中国所有铁路线路及车次信息，但是并没有任何网站或文章直接将所有信息整合在一起提供出来，因此只能自己从页面上扒。

这里利用到了python的selenium模块，自动定位操作网页，然后通过其他方式获取页面信息，以达到数据搜索整合的目的。

我使用的是pycharm工具作为环境运行代码的，直接在setting中安装就可以，各位也可以用pip命令安装，很方便，这里不赘述

安装过后需要chrome浏览器的支持，尤其需要chromedriver驱动，否则无法进行网页的打开以及自动操作

关于chrome和chromedriver的安装不是本文重点，有不理解的小伙伴可以百度搜索安装一下

这里是一个简单的小例子，也是网上可以搜到的，需要了解的是里面的操作

from selenium import webdriver
from time import sleep


if __name__ == '__main__':

    driver = webdriver.Chrome()
    driver.get("http://www.baidu.com")
    driver.maximize_window()
    driver.find_element_by_id("kw").send_keys("Python")
    sleep(3)
    driver.find_element_by_id("su").click()
    # driver.quit()

第一步指定chrom浏览器

第二步设置网址