htmlunit获取指定元素

最新推荐文章于 2018-06-07 15:19:26 发布

待烟火清凉

最新推荐文章于 2018-06-07 15:19:26 发布

阅读量4.1k

点赞数

分类专栏： htmlunit

本文链接：https://blog.csdn.net/gcxzflgl/article/details/74903757

版权

htmlunit 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

htmlunit 提供了丰富的api来获取指定元素 jsoup有的 htmlunit也有

package com.gcx.htmlunit;

import java.io.IOException;
import java.net.MalformedURLException;

import com.gargoylesoftware.htmlunit.BrowserVersion;
import com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException;
import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.DomElement;
import com.gargoylesoftware.htmlunit.html.DomNodeList;
import com.gargoylesoftware.htmlunit.html.HtmlDivision;
import com.gargoylesoftware.htmlunit.html.HtmlListItem;
import com.gargoylesoftware.htmlunit.html.HtmlPage;

public class Search {
	public static void main(String[] args) {
		//实例化web客户端 模拟指定浏览器
		WebClient wc=new WebClient(BrowserVersion.FIREFOX_45);
		try {
			//解析获取页面
			HtmlPage page = wc.getPage("http://www.bjsxt.com");
			//查找指定id 的 html dom元素
			HtmlDivision hd  = page.getHtmlElementById("LRdiv0");
			System.out.println(hd.asXml());
			
			System.out.println("-------------------------------");
			//根据tag名称查找所有tag
			DomNodeList<DomElement> elementsByTagName = page.getElementsByTagName("a");
			for(int i=0;i<elementsByTagName.getLength();i++){
				DomElement domElement = elementsByTagName.get(i);
				System.out.println(domElement.asXml());
			}
			System.out.println("-------------------------------");
			//获取指定xpath
			HtmlListItem item= (HtmlListItem) page.getByXPath("//div[@id='navMenu'][1]/ul/li").get(0);
			System.out.println(item.asXml());
		} catch (FailingHttpStatusCodeException e) {
			e.printStackTrace();
		} catch (MalformedURLException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
			wc.close();//关闭客户端，释放资源
		}
		
	}
}

待烟火清凉

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
htmlunit获取指定元素

htmlunit 提供了丰富的api来获取指定元素 jsoup有的 htmlunit也有package com.gcx.htmlunit;import java.io.IOException;import java.net.MalformedURLException;import com.gargoylesoftware.htmlunit.BrowserVersion;impor
复制链接

扫一扫