爬虫自动更换代理

代理地址存放在quene队列或redis的list中,格式为ip:port         

建立一个更换代理的类
public  class  Proxy {
      public  static  String  ip  =  "218.189.26.20" ;
      public  static  int  port  = 8080;

      public  void  change() {
           
           RedisUtil redisUtil = new RedisUtil();
           String poll = redisUtil.poll(" proxy");
           String[] split = poll.split(":");
           ip = split[0];
           port=Integer.parseInt(split[1]);

           System.  out .println(  "代理更换成功"  + ip + "-------"  + port );

     }
}

在httpclient中,调用上述类的静态变量

           HttpClientBuilder  builder  = HttpClients. custom();
           String  hostname  = Proxy.  ip ;
             int   port  = Proxy.  port ;
           
           HttpHost  proxy  =  new  HttpHost(  hostname port );
           CloseableHttpClient  client  =  builder .setProxy(  proxy ).build();

当页面下载失败时,调用change方法,重新从队列中获取代理,此时还应该将下载失败的url重新放回下载队列
               if ( content  .contains( "存在异常流量"  )){
                     
                       logger .info(  "代理已失效,开始换代理"  );
                       Proxy  proxy  =  new  Proxy();
                       proxy .change();
                }
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值