Linux服务器部署Selenium动态认证代理

最近在爬英国一些电商网站时,需要使用代理来避免被封。这边使用的是某网站的账密认证代理。构建拓展:extension.py

import zipfile


def proxies(username, password, endpoint, port):
    manifest_json = """
    {
        "version": "1.0.0",
        "manifest_version": 2,
        "name": "Proxies",
        "permissions": [
            "proxy",
            "tabs",
            "unlimitedStorage",
            "storage",
            "<all_urls>",
            "webRequest",
            "webRequestBlocking"
        ],
        "background": {
            "scripts": ["background.js"]
        },
        "minimum_chrome_version":"22.0.0"
    }
    """

    background_js = """
    var config = {
            mode: "fixed_servers",
            rules: {
              singleProxy: {
                scheme: "http",
                host: "%s",
                port: parseInt(%s)
              },
              bypassList: ["localhost"]
            }
          };

    chrome.proxy.settings.set({value: config, scope: "regular"}, function() {});

    function callbackFn(details) {
        return {
            authCredentials: {
                username: "%s",
                password: "%s"
            }
        };
    }

    chrome.webRequest.onAuthRequired.addListener(
                callbackFn,
                {urls: ["<all_urls>"]},
                ['blocking']
    );
    """ % (endpoint, port, username, password)

    extension = 'proxies_extension.zip'

    with zipfile.ZipFile(extension, 'w') as zp:
        zp.writestr("manifest.json", manifest_json)
        zp.writestr("background.js", background_js)

    return extension

然后在爬虫中使用:

from discount_spider_extension import proxies

proxies_extension = proxies(proxies_user_name, proxies_password, proxies_endpoint, proxies_port) #这里各项认证需用自己的

options = webdriver.ChromeOptions()
#options.add_argument('--headless')
options.add_argument('--no-sandbox')
options.add_argument('--disable-dev-shm-usage')
options.add_experimental_option('excludeSwitches', ['enable-logging'])
options.add_extension(proxies_extension)

# 启动 Chrome 浏览器
driver = webdriver.Chrome(options=options, executable_path="/home/spider/chromedriver")
driver.set_window_size(1920, 1080)

这样就可以正常使用了。注意不可使用无头模式,否则会启动失败。如果部署在无界面的服务器,则要在启动driver之前添加代码:

from pyvirtualdisplay import Display# 在chromedriver启动前启动一个显示器
display = Display(visible=0, size=(800, 800))
display.start()

这样就可以构建虚拟显示器用于chromedriver。需要先安装库:

yum install Xvfb
pip install pyvirtualdisplay

要使用Docker部署云服务器,你可以按照以下步骤进行操作: 1. 首先,你需要在云服务器上安装Docker CE。你可以使用以下命令安装Docker的依赖库: ``` yum install -y yum-utils device-mapper-persistent-data lvm2 ``` 2. 添加Docker CE的软件源信息,可以使用以下命令: ``` yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo ``` 3. 安装Docker CE,使用以下命令: ``` yum makecache fast yum -y install docker-ce ``` 4. 启动Docker服务,使用以下命令: ``` systemctl start docker ``` 5. 确保Docker服务已成功启动,可以使用以下命令来检查Docker的版本信息: ``` docker version ``` 6. 接下来,你可以使用git工具将你的项目拉取到云服务器中。如果你不熟悉git的使用,可以参考git的简单操作教程来学习如何使用git。 7. 最后,你可以使用Docker来部署你的应用程序。你可以搜索Docker镜像仓库中的Nginx镜像版本,并根据你的需求选择一个合适的版本,使用以下命令来搜索可用的Nginx版本: ``` docker search nginx ``` 选择一个适合你的版本,并使用以下命令来拉取Nginx镜像: ``` docker pull <nginx-image-name>:<tag> ``` 这将拉取所选版本的Nginx镜像到你的云服务器中。 请注意,这只是一个大致的指南,你可能还需要根据你的具体情况进行一些额外的配置和调整。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [在云服务器快速搭建Docker环境](https://blog.csdn.net/segwy/article/details/125094348)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [Docker部署selenium程序-从本地到云服务器-详细步骤](https://blog.csdn.net/qq_51898139/article/details/126360693)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值