今天由于需要解决动态内容的爬取问题要用到selenium,新装的环境里又没有安装相关软件和类库,只能重头来,记录下自己在安装中碰到的坑。
1、一开始图方便直接用pip安装到了selenium3.X,firefox也是用yum安装到了52.x的版本,搞了很久最后没搞定,放弃。
2、firefox重新会退到46.X版本,启动时报找不到libgtk-3.so.0的错误,百度了很久发现CentOS6.5最多支持到45.X的版本,再往上需要更新lib库,我因为是手动安装firefox旧版本,升级太麻烦,选择直接回退到45.X版本。
wget https://ftp.mozilla.org/pub/firefox/releases/45.0.2/linux-x86_64/zh-CN/firefox-45.0.2.tar.bz2
3、手动启动firefox,正常了,没有报找不到文件的错误,但是在PyVirtualDisplay下运行selenium调用firefox还是不行。
4、只能继续回退版本,在此期间PyVirtualDisplay回退到了0.1.5版本,selenium回退到2.52.0版本。再次启动报了一个新的错误“the browser appears to have exited...”,看不到更详细的日志。
5、百度了一下,driver = webdriver.Firefox(firefox_binary = webdriver.firefox.firefox_binary.FirefoxBinary(log_file = open ('/tmp/selenium.log', 'a