爬虫复杂的请求方法

1.代理IP原理:以本机先访问代理IP,再通过代理IP地址访问互联网,这样网站接受到的访问IP就是代理IP地址。


#代理IP
import requests

proxies = {
    "http":"http://10.10.1.10:3128",
    "https":"http://10.10.1.10:1080",
}

r = requests.get("http://www.baidu.com",proxies = proxies)

2.请求头;


import requests

headers = {
    "User-Agent":"Mozilla/5.0"
}
r = requests.get("http://www.baidu.com",headers = headers)
print(r.status_code)

3.超时设置:发送请求后,由于网络,服务器等因素,请求到获得相应会有一个时间差,如果不想程序等待时间过长或者延长等待时间,可以设定tiemout的等待秒数,超过这个时间之后停止等待响应,如果服务器在timeout秒内没有应答,将会引发一个异常。

r = requests.get("http://www.baidu.com",timeout = 0.1)

4.证书验证
一些特殊的网站需要安装证书,如12306,确保数据传输的安全性程序中通常设置关闭验证即可。默认情况下是True

r = requests.get("http://www.baidu.com",verify = False)

开启证书验证

r = requests.get("http://www.baidu.com",verify = True)

如果需要设置证书文件,可以设置证书路径

r = requests.get("http://www.baidu.com",verify = "证书路径")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值