我想要爬取国外网站信息,但是由于需要长时间挂梯子进行一些交互。因此用python爬取数据时就会报以下错误。
我找了好多解决办法,但大多数都不是由于挂代理而引起的。
这里我只针对挂代理进行爬取而出现这种报错提供一个解决方法。
在代码里加入协议改一下ip端口就好
proxy={
"https": "127.0.0.1:7890",
"http": "127.0.0.1:7890"
}
上面的7890端口就是我的代理的端口号,不同的代理可能端口号不一样,只需要查看自己的代理里面的设置中的端口号加入代码:
proxy={
"https": "127.0.0.1:你的端口号",
"http": "127.0.0.1:你的端口号"
}
然后发送请求时,proxies复制一下就好了
response = requests.get(url,proxies=proxy)
这样设置完就可以挂代理的同时爬取数据不引起报错了。