java 拼html页面返回,java – htmlunit:返回一个完全加载的页面

我正在使用

HtmlUnit库for

Java以编程方式操作网站.我找不到解决问题的方法:如何确定所有AJAX调用都已完成并返回一个完全加载的网页?这是我尝试过的:

首先我创建WebClient实例并调用我的方法processWebPage(String url,WebClient webClient)

WebClient webClient = null;

try {

webClient = new WebClient(BrowserVersion.FIREFOX_3_6);

webClient.setThrowExceptionOnScriptError(false);

webClient.setThrowExceptionOnFailingStatusCode(false);

webClient.setJavaScriptEnabled(true);

webClient.setAjaxController(new NicelyResynchronizingAjaxController());

} catch (Exception e) {

System.out.println("Error");

}

HtmlPage currentPage = processWebPage("http://www.example.com", webClient);

这是我的方法,它应该返回一个完全加载的网页:

private static HtmlPage processWebPage(String url, WebClient webClient) {

HtmlPage page = null;

try {

page = webClient.getPage(url);

} catch (Exception e) {

System.out.println("Get page error");

}

int z = webClient.waitForBackgroundJavaScript(1000);

int counter = 1000;

while (z > 0) {

counter += 1000;

z = webClient.waitForBackgroundJavaScript(counter);

if (z == 0) {

break;

}

synchronized (page) {

System.out.println("wait");

try {

page.wait(500);

} catch (InterruptedException e) {

e.printStackTrace();

}

}

}

System.out.println(page.asXml());

return page;

}

如果没有要加载的JavaScript,那个z变量应返回0.

有什么想法吗?提前致谢.

编辑:我发现我的问题部分工作的解决方案,但在这种情况下,我应该知道响应页面的外观.例如,如果完全加载的页面包含文本“完成”,我的解决方案将是:

HtmlPage page = null;

int PAGE_RETRY = 10;

try {

page = webClient.getPage("http://www.example.com");

} catch (Exception e) {

e.printStackTrace();

}

for (int i = 0; !page.asXml().contains("complete") && i < PAGE_RETRY; i++) {

try {

Thread.sleep(1000 * (i + 1));

page = webClient.getPage("http://www.example.com");

} catch (Exception e) {

e.printStackTrace();

}

}

但是,如果我不知道完全加载的页面是什么样的,那么解决方案是什么?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值