OpenFeign配置代理爬虫调用

通常我们在写爬虫时候,为了规避目标网站限制通常采用代理方式调用,普遍的做法是通过定时任务去一些免费代理网站获取代理服务IP+Port,远程调用时候通过循环可用的代理去抓取目标网站内容;

OpenFeign配置代理服务器的步骤总结如下:

  1. OpenFeign使用方式:见之前文章@FeignClient中的fallbackFactory,fallback不起作用的正确使用示例
  2. application.yml添加配置,采用okhttp方式远程调用
feign:
  httpclient:
    enabled: false
  okhttp:
    enabled: true
  1. pom.xml配置增加
	<dependency>
            <groupId>io.github.openfeign</groupId>
            <artifactId>feign-okhttp</artifactId>
        </dependency>
	<dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-openfeign</artifactId>
        </dependency>
  1. Feign自动化配置增加如下代码
    @Bean
    public OkHttpClientFactory okHttpClientFactory(OkHttpClient.Builder builder) {
        return new ProxyOkHttpClientFactory(builder);
    }
    
    static class ProxyOkHttpClientFactory extends DefaultOkHttpClientFactory {
        
        public ProxyOkHttpClientFactory(OkHttpClient.Builder builder) {
            super(builder);
            //配置IP、端口
            Proxy proxy = new Proxy(Proxy.Type.HTTP, new InetSocketAddress("222.162.185.176", 4524));
            builder.proxy(proxy);
            /*
            builder.proxyAuthenticator(new Authenticator() {
                @Override
                public Request authenticate(Route route, Response response) throws IOException {
                    //设置代理服务器账号密码
                    String credential = Credentials.basic("admin", "admin");
                    return response.request().newBuilder()
                            .header("Proxy-Authorization", credential)
                            .build();
                }
            });*/
            //如果要配置限制域则加上下面
            /*List<Proxy> proxyList = new ArrayList<>(1);
            proxyList.add(proxy);
            builder.proxySelector(new ProxySelector() {
                //限制域
                Set<String> domainList;
                @Override
                public List<Proxy> select(URI uri) {
                    if (uri == null || !domainList.contains(uri.getHost())) {
                        return Collections.singletonList(Proxy.NO_PROXY);
                    }
                    return proxyList;
                }
                @Override
                public void connectFailed(URI uri, SocketAddress sa, IOException ioe) {
                }
            });*/
        }
    }
  1. 将自己的代理服务器ip+port替换即可;关于如何寻找高质量免费的代理有时间单独更新一篇博文总结一下;

获取更多相关文章请点击木易成-开发者天地,不定时分享个人技术观点、股票交易经验、生活经历、NBA观点等精彩信息。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值