1.requests pip3 install requests
2.selenium pip3 install selenium
3.安装谷歌和火狐浏览器
4.chromeDriver和geckoDriver [github上搜索,windows复制到python的
scripts目录下,linux 系统配置环境变量或者移动到/usr/bin目录
sudo mv chromeDriver /usr/bin
sudo mv geckoDriver /usr/bin
或者配置环境变量
谷歌
将可执行文件放到/usr/local/chromeDriver
~/.profile
export PATH="$PATH://usr/local/chromeDriver"
保存后执行如下命令
source ~/.profile
验证
控制台 geckoDriver
python代码
from selenium import webdriver
browser=webdriver.Chrome()
如果弹出空白的谷歌浏览器则成功
火狐
将可执行文件放到/usr/local/geckoDriver
~/.profile
export PATH="$PATH://usr/local/geckoDriver"
保存后执行如下命令
source ~/.profile
验证
控制台 geckoDriver
python代码
from selenium import webdriver
browser=webdriver.Firefox()
如果弹出空白的火狐浏览器则成功
5.phantomJs
GitHub或者官网下载
Windows是将bin目录添加到环境变量,或者
直接复制到python的scripts文件夹
或者直接
sudo apt install phantomjs
测试是否安装成功
phantomjs
出现phantomjs命令行说明成功
代码测试
from selenium import webdriver
browser=webdriver.PhantomJS()
browser.get("https://www.baidu.com")
print(browser.current_url)
6.selenium已经放弃PhantomJS了,建议使用火狐或者谷歌无界面浏览器。
使用无界面浏览器Selenium+Headless Firefox
Selenium+Headless Firefox和Selenium+Firefox,区别就是实例option的时候设置-headless参数。
前提条件:
- 本地安装Firefox浏览器
- 本地需要geckodriver驱动器文件,如果不配置环境变量的话,需要手动指定executable_path参数。
7.from selenium.webdriver import Firefox
from selenium.webdriver.firefox.options import Options
def main():
options = Options()
options.add_argument('-headless')
driver = Firefox(executable_path='/usr/bin/geckodriver
', firefox_options=options)
driver.get("https://www.baidu.com")
print(driver.page_source)
driver.close()
if __name__ == '__main__':
main()
8.安装异步web服务库aiohttp
pip3 install aiohttp
字符串编码检测库 cchardet
加速DNS的解析库aiodns
pips install cchardet aiodns
9.Could not find a version that satisfies the requirement aiohttp等解决办法
更新pip
pip install --upgrade pip
python3
pip3 install --upgrade pip
爬虫请求库的安装
最新推荐文章于 2023-04-25 17:12:35 发布