最近由于工作原因,开始进行一些爬虫的学习。记录一下我第一个爬虫踩过的坑!
首先感谢github给了我学习下去的动力。我使用的是python3.5,在window10下运行。爬虫用的是selenium+webserver的组合。
问题记录:
1、开始的化想使用webdriver.PhantomJS,但是报错
所以 PhantomJS是不能刚在3.5使用的,要使用headless
本人由于个人喜好问题,最后选用了chrome
2、在使用安装headless的时候一定要选择版本匹配。在chrome地址栏里面输入chrome://version/
这个 chrome的版本号一定要匹配chromedriver的版本。
<