因为项目原因,需要获取中国所有铁路线路及车次信息,但是并没有任何网站或文章直接将所有信息整合在一起提供出来,因此只能自己从页面上扒。
这里利用到了python的selenium模块,自动定位操作网页,然后通过其他方式获取页面信息,以达到数据搜索整合的目的。
我使用的是pycharm工具作为环境运行代码的,直接在setting中安装就可以,各位也可以用pip命令安装,很方便,这里不赘述
安装过后需要chrome浏览器的支持,尤其需要chromedriver驱动,否则无法进行网页的打开以及自动操作
关于chrome和chromedriver的安装不是本文重点,有不理解的小伙伴可以百度搜索安装一下
这里是一个简单的小例子,也是网上可以搜到的,需要了解的是里面的操作
from selenium import webdriver
from time import sleep
if __name__ == '__main__':
driver = webdriver.Chrome()
driver.get("http://www.baidu.com")
driver.maximize_window()
driver.find_element_by_id("kw").send_keys("Python")
sleep(3)
driver.find_element_by_id("su").click()
# driver.quit()
第一步指定chrom浏览器
第二步设置网址