Centos7.5 服务器搭建Selenium 爬虫详细教程

Centos7.5 服务器搭建Selenium 爬虫详细教程

测试成功时间2020.03.12

1.安装python

我安装的是python3.6
需要给服务器安装Python环境

最新的EPEL 7仓库提供了Python3(python 3.6)的安装源,如果你使用CentOS7或更新的版本的系统你也可以按照下面的步骤很轻松的从EPEL仓库安装。
安装最新版本的EPEL

sudo yum install epel-release

用yum安装python 3.6:

sudo yum install python36

注意:上面的安装方法并未安装pip和setuptools,如果你要安装这两个库可以使用下面的命令:

curl -O https://bootstrap.pypa.io/get-pip.py
sudo /usr/bin/python3.6 get-pip.py

安装python的库,这里使用国内的清华镜像源快速安装

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple selenium

2.安装Chrome浏览器

2.1.安装chrome浏览器,创建yum源文件

cd /etc/yum.repos.d/
touch google-chrome.repo
vi google-chrome.repo

2.2 输入yum源信息

[google-chrome]
name=google-chrome
baseurl=http://dl.google.com/linux/chrome/rpm/stable/$basearch
enabled=1
gpgcheck=1
gpgkey=https://dl-ssl.google.com/linux/linux_signing_key.pub

查看版本:

[root@localhost ~] google-chrome -version
Google Chrome 70.0.3538.77 

2.3 安装google chrome和chromedriver
按照chrome的版本安装对应的webdriver
下载地址:https://sites.google.com/a/chromium.org/chromedriver/downloads
国内源:http://npm.taobao.org/mirrors/chromedriver/
(可参照安装文档:https://selenium-python.readthedocs.io/installation.html)

这边下载好chromdriver后,使用rz命令上传,rz需要先下载lrzsz
直接下载源

[root@localhost ~]yum install https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm
[root@localhost ~]yum -y install lrzsz
[root@localhost ~]rz -y

由于直接使用当前目录下的chromedriver可能权限不够,所以要更换位置

[root@localhost ~] mv chromedriver /usr/local/bin/
[root@localhost bin] chmod 777 chromedriver

## 3.测试代码

```powershell
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
opt = Options()
opt.set_headless()
opt.add_argument('--no-sandbox')
opt.add_argument('--disable-dev-shm-usage')
opt.add_argument('--headless')
opt.add_argument('blink-settings=imagesEnabled=false')
opt.add_argument('--disable-gpu')
driver = webdriver.Chrome(chrome_options=opt,executable_path="/usr/bin/chromedriver")
driver.get('http://www.baidu.com')

测试成功

4.一些注意点

在这里插入图片描述
如果出现这样的情况,那么你缺少基本的这些配置代码

opt = Options()
opt.set_headless()
opt.add_argument('--no-sandbox')
opt.add_argument('--disable-dev-shm-usage')
opt.add_argument('--headless')
opt.add_argument('blink-settings=imagesEnabled=false')
opt.add_argument('--disable-gpu')

另外chromedriver的路径和版本问题需要注意

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码王吴彦祖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值