前言:之前靠网上的大佬带,学了一点也算是爬虫的一个东西——浏览器自动化,现在算是整理总结或者是回报社会吧x
准备:① Python 3.6
② selenium库
③ google chrome driver (感谢 https://blog.csdn.net/dreamstone_xiaoqw/article/details/78970616 的分享,我当时在官网下超慢)
装好这两个东西就可以开始我们的爬虫之旅了,下面以从12306网站抓取车次信息为案例学习这个库。
浏览器自动化操作大体分为两步——定位和操作,而其中最重要的是定位,因为定位是最困难的并且只有定位到了想要的位置才能进行后续的操作。
首先,我们要打开一个浏览器并访问12306网站——http://www.12306.cn/
from selenium import webdriver
x=webdriver.Chrome(r'C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe')
#这是我的chromedriver的绝对路径,我是默认安装的,所以可以作为新手的参考
x.get(