htmlunit使用代理IP

有时候频繁的爬取第三方站点内容,会被站点的防火墙拦截,IP拉黑,所以这时候,就要用到代理IP,拉黑一个就换一个


htmlunit实用代理的方式比较简单,WebClient重载构造方法就有提供


package com.gcx.htmlunit;

import java.io.IOException;
import java.net.MalformedURLException;

import com.gargoylesoftware.htmlunit.BrowserVersion;
import com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException;
import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.DomElement;
import com.gargoylesoftware.htmlunit.html.DomNodeList;
import com.gargoylesoftware.htmlunit.html.HtmlDivision;
import com.gargoylesoftware.htmlunit.html.HtmlListItem;
import com.gargoylesoftware.htmlunit.html.HtmlPage;

public class IpSearch {
	public static void main(String[] args) {
		//实例化web客户端 模拟指定浏览器
		WebClient wc=new WebClient(BrowserVersion.FIREFOX_52,"60.2.148.253",80);
		try {
			//解析获取页面
			HtmlPage page = wc.getPage("https://www.baidu.com");
			//获取html
			System.out.println("网页:"+page.asXml());
			
		} catch (FailingHttpStatusCodeException e) {
			e.printStackTrace();
		} catch (MalformedURLException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
			wc.close();//关闭客户端,释放资源
		}
		
	}
}


这里代理IP如何找 ,很多网站都有提供的,介绍一个http://www.data5u.com




运行效果和前面一样,只是速度会慢点 毕竟用了代理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值