常见的反爬手段和解决思路

反爬策略1:通过UA限制或者其他头信息限制
解决方案:构建用户代理池或其他头信息

反爬策略2:通过访问者IP限制
解决方案:构建IP代理池

反爬策略3:通过验证码限制
解决方案:手工打码、验证码接口自动识别或者通过机器学习自动识别

反爬策略4:通过数据的异步加载限制
解决方案:抓包分析或者使用PhantomJS

反爬策略5:通过Cookie限制
解决方案:进行Cookie处理

反爬策略6:通过JS限制(如请求的数据通过JS随机生成等)
解决方案:分析JS解密或者使用PhantomJS


当然,在使用爬虫时,还是要遵循网站的robots约定,不要对网站造成影响。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值