Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器)。
PhantomJS 是一个基于Webkit的“无界面”(headless)浏览器,它会把网站加载到内存并执行页面上的 JavaScript,因为不会展示图形界面,所以运行起来比完整的浏览器要高效。
# 如果没有在环境变量指定PhantomJS位置
这个路径是你windows中phantomjs.exe的绝对路径
E:\Python\pythonWork\urllib2\venv\Lib\site-packages\phantomjs_bin\bin\windows\phantomjs.exe
这样就可以创建driver了
driver = webdriver.PhantomJS(executable_path=r'E:\Python\pythonWork\urllib2\venv\Lib\site-packages\phantomjs_bin\bin\windows\phantomjs.exe')
为什么要加r呢?
因为反斜杠在Python中被定义为转义标记(这个在正则表达式里常用,如\\ \.\|就是对应实际的\.|),
为在Windows中确保万无一失,应以原始字符串的方式指定路径,即在开头的单引号前加上r.