selenium网页自动化工具使用一则

本文介绍了使用Python的Selenium库进行网页自动化控制的详细步骤,包括防止网站检测、页面元素查找、等待策略、元素操作、窗口切换、异常处理以及浏览器工具的使用技巧。特别强调了在Chrome中如何避免自动化检测,以及如何有效处理和操作页面元素。
摘要由CSDN通过智能技术生成

应用场景

使用浏览器自动控制登录网站,并完成PayPal的付款

准备

准备使用python语言完成开发,需要做如下准备工作:

  1. 安装python3.8
  2. 安装pycharm(python IDE,可选安装)
  3. 使用pip安装selenium 在windows powershell下键入 pip install
  4. 根据浏览器类型,安装对应的webdriver

设计要点

1. 防止网站检测

很多网站对selenium有检测行为,由selenium直接使用WebDriver来操纵浏览器会使其被检测出,对于chrome浏览器,使用调试端口以本地套接口来操纵,可以避免被检测出使用了自动化工具,范例如下:

def get_driver(port):
    # 测试调试浏览器是否已打开
    sk = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    sk.settimeout(0.5)
    try:
        sk.connect(('127.0.0.1', port))
    except:
        # 通过cmd方式打开一个Chrome浏览器
        open_str = r'C:\Program Files (x86)\Google\Chrome\Application\chrome.exe --remote-debugging-port=%d \
                    --user-data-dir="d:\selenium\AutomationProfile"' % port
        subprocess.Popen(open_str)
        my_log('当前使用的是谷歌桥接浏览器')
    sk.close()

    # 桥接到已经打开的Chrome浏览器
    try:
        options = webdriver.ChromeOptions()
        options.add_experimental_option("debuggerAddress", 
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值