遇到网站的反爬虫机制，那么我们应该来如何应对呢？

最新推荐文章于 2024-05-13 17:48:00 发布

其实还好啦

最新推荐文章于 2024-05-13 17:48:00 发布

阅读量1.5k

点赞数

分类专栏：爬虫文章标签： python 编程语言爬虫

本文链接：https://blog.csdn.net/qq_46614154/article/details/106413626

版权

遇到网站的反爬虫机制，那么我们应该来如何应对呢？

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

1、使用代理

适用情况：限制IP地址情况，也可解决由于“频繁点击”而需要输入验证码登陆的情况。

这种情况最好的办法就是维护一个代理IP池，网上有很多免费的代理IP，良莠不齐，可以通过筛选找到能用的。对于“频繁点击”的情况，我们还可以通过限制爬虫访问网站的频率来避免被网站禁掉。

proxies = {'http':'http://XX.XX.XX.XX:XXXX'}
Requests：
  import requests
  response = requests.get(url=url, proxies=proxies)
Urllib2：
  import urllib2
  proxy_support = urllib2.ProxyHandler(proxies)
  opener = urllib2.build_opener(proxy_support, urllib2.HTTPHandler)
  urllib2.install_opener(opener) # 安装opener，此后调用urlopen()时都会使用安装过的opener对象
  response = urllib

最低0.47元/天解锁文章

其实还好啦

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
遇到网站的反爬虫机制，那么我们应该来如何应对呢？

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。1、使用代理适用情况：限制IP地址情况，也可解决由于“频繁点击”而需要输入验证码登陆的情况。这种情况最好的办法就是维护一个代理IP池，网上有很多免费的代理IP，良莠不齐，可以通过筛选找到能用的。对于“频繁点击”的情况，我们还可以通过限制爬虫访问网站的频率来避免被网站禁掉。proxies = {'http':'http://XX.XX.XX.XX:XXXX'...
复制链接

扫一扫