Python爬虫添加代理IP池(新手)

给爬虫添加代理IP池

我们在运行爬虫的过程中由于请求次数过多经常会遇到被封IP的情况,这时就需要用到代理IP来解决。代理IP的原理,简单来说就像在本机和web服务器之间开一个中转站,把本机的请求交给代理IP服务器,由它帮本机向web服务器发送请求,再把响应返回给本机。

下载安装代理IP池

这是一个在github上人气比较高的代理池,使用的是Redis数据库。由于都是免费代理,所以质量并不高,但供大家学习已经够用。里面也可以自己设置收费的代理ip,但在本文不会写到。
地址:https://github.com/jhao104/proxy_pool
这是一个在gayhub上面人气很高的免费代理池
下载解压后,在cmd里进入到解压的路径,运行此命令安装依赖。

pip install -r requirements.txt

在这里插入图片描述
在解压后的文件夹里找到Config\setting.py,notepad++或者你的ide打开进行修改。
在这里插入图片描述
在这里插入图片描述
接下来在cmd里面进入Run目录运行 。

python main.py

在这里插入图片描述
成功开启代理池!
我们也可以打开RedisDesktopManager来看看。
在这里插入图片描述

接下来我们来测试一下这个代理池能不能用。

爬取天天基金网“热门主题”的基金名称

  1. 首先找到这个代理池的使用demo
  • 6
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值