爬虫笔记7:requests设置代理IP

博客介绍了爬虫设置代理IP的原因,是为避免被网站识别封号。还说明了获取IP的途径,包括外网和内网IP获取方法。详细阐述了爬取IP、设置代理IP、寻找免费代理IP的方法,以及验证代理IP有效性的方式,帮助爬虫隐藏真实IP。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、为什么要设置代理IP
爬虫爬取网站时,如果被对方识别是爬虫,就很可能被封号(即不能访问该网站)。
在这里插入图片描述
二、怎么获取IP
1.通过网站:https://www.ipip.net/(获取外网IP)
在这里插入图片描述
2.通过网站:http://httpbin.org/ip
在这里插入图片描述

3.在cmd里输入:ipconfig(获取内网IP,局域网)
在这里插入图片描述
我们要隐藏的是外网ip

三、方法
1、怎么爬取ip(就是模拟上述获取ip的方法)
在这里插入图片描述
2、怎么设置代理ip

import requests

url = 'http://httpbin.org/ip'
# 设置代理ip
proxy = {
    'http':'113.121.79.133:9999'
}
res = requests.get(url,proxies=proxy)
print(res.text)

结果:
在这里插入图片描述
如果没有报错(见下面的第4点怎么验证1个ip),那我们真实的IP(见上面的第1点怎么爬取ip)就被我们设置的代理ip给成功隐藏了。
3、怎么找到一些免费的代理IP
(1)通过网站:快代理(https://www.kuaidaili.com/free/)
在这里插入图片描述
(2)通过网站:豌豆HTTP(https://h.wandouip.com/)
第1步:注册
第2步:在‘我的豌豆’里点击‘IP白名单’
第3步:输入自己的IP
第4步:点击‘工具’–‘提取API’
第5步:
在这里插入图片描述
第6步:将复制的链接在新页面粘贴打开
在这里插入图片描述
4、怎么验证代理IP的有效性
(1)验证1个IP:
在这里插入图片描述
(2)验证多个IP:

import requests


ips = [('113.117.117.121:766'),('182.87.240.142:36410'),('113.117.25.54:894'),('125.123.121.223:766'),('114.100.3.14:3617')]
url = 'http://httpbin.org/ip'

for i in ips:
    try:
        res = requests.get(url,proxies={'http':i},timeout=0.5)
        print(res.text)
    except Exception as e:
        print('出现异常',e)

结果:
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值