我正在用Java编写一个程序,用于在单击页面底部的下一个按钮后从一系列页面中删除源代码。我的代码是目前:如何在Html单击按钮后单击刷新页面
public class Htmlunitscraper {
private static String s = "http://cpdocket.cp.cuyahogacounty.us/SheriffSearch/results.aspx?q=searchType%3dSaleDate%26searchString%3d10%2f21%2f2013%26foreclosureType%3d%27NONT%27%2c+%27PAR%27%2c+%27COMM%27%2c+%27TXLN%27";
public static String scrapeWebsite() throws IOException {
final WebClient webClient = new WebClient();
final HtmlPage page = webClient.getPage(s);
final HtmlForm form = page.getForms().get(0);
final HtmlSubmitInput button = form.getInputByValue(">");
final HtmlPage page2 = button.click();
int amountOfTries = 10;
while (amountOfTries > 0 && String originalHtml = page2.getWebResponse().getContentAsString() !=page.getWebResponse().getContentAsString()) {
amountOfTries--;
synchronized (page) {
page.wait(1000);
}
}
return originalHtml;
}
}
这是我第一次使用的HtmlUnit,所以我一直提到这个post。对于初学者来说,我不确定班级“表格”是如何工作的,以及它究竟做了什么。但对于我的问题,正在打印的字符串是来自原始网页的源代码,而不是在单击下一个按钮之后。当从URL中手动查看源代码时,一旦我点击下一个按钮,我必须刷新页面以查看更新后的源代码,所以想象一下,我将不得不在我的程序中模拟此代码。我会如何去做这件事?即使添加刷新方法后,它仍然无法正常工作。
2013-10-16
Ctech45