电商网站反爬策略

1、电商网站反爬
电商网站的反爬策略是非常严格的。爬虫用selenium访问电商网站时会出现验证码,但是通过不了。原来是很多网站对selenium有严格检测。检测是不是$cdc_asdjflasutopfhvcZLmcfl 、navigator.webdriver等这些特俗标志。当然我们也可以通过这个在电商网站的JS中看到相关的检测代码信息:
在控制台下输入以下命令window.navigator.webdriver会发现和正常的浏览器打开的有所不同
2、修改selenium
正常的浏览器都会检测到selenium。这时就需要设置开发者模式,避免目标网站检测出selenium或者修改浏览器的webdriver
3、启用代理
配置上亿牛云代理的方式

启动时设置上游代理服务器

代理服务器地址、端口、用户名、密码请替换成自己的

mitmproxy --mode=upstream:http://t.16yun.cn:31111 --upstream-auth=username:password
代码demo:

<?php // 要访问的目标页面 $url = "http://httpbin.org/ip"; $urls = "https://httpbin.org/ip"; // 代理服务器(产品官网 www.16yun.cn) define("PROXY_SERVER", "tcp://t.16yun.cn:31111"); // 代理身份信息 define("PROXY_USER", "username"); define("PROXY_PASS", "password"); $proxyAuth = base64_encode(PROXY_USER . ":" . PROXY_PASS); // 设置 Proxy t
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值