1.解析页面 http://www.baidu.com/more/
a.获取所有服务名称:
package com.siqi.samples;
import com.siqi.htmlparser.HtmlParser;
import com.siqi.htmlparser.Tag;
import com.siqi.htmlparser.WebUtils;
public class TestWebPage {
public static void main(String... args) {
try {
//获取网页
WebUtils webUtil = new WebUtils();
webUtil.processUrl("http://www.baidu.com/more/");
//解析网页
HtmlParser parser = new HtmlParser(webUtil.getWebContent(),webUtil.getCharset());
parser.parse();
//打印网页标签路径为"html/body/div/div/div/div/h3"的内容
String values = "";
for(String str : parser.getTagValues("html/body/div/div/div/div/h3")) {
values = values + str + " ";
}
System.out.println(values);
} catch (Exception e) {
e.printStackTrace();
}
}
}
结果:
新上线新! 搜索服务 导航服务 社区服务 游戏娱乐 移动服务 站长与开发者服务 软件工具 其他服务
b.获取所有产品名称:
代码:
package com.siqi.samples;
import com.siqi.htmlparser.HtmlParser;
import com.siqi.htmlparser.Tag;
import com.siqi.htmlparser.WebUtils;
public class TestWebPage {
public static void main(String... args) {
try {
//获取网页
WebUtils webUtil = new WebUtils();
webUtil.processUrl("http://www.baidu.com/more/");
//解析网页
HtmlParser parser = new HtmlParser(webUtil.getWebContent(),webUtil.getCharset());
parser.parse();
//打印网页标签路径为"html/body/div/div/div/div/div/div/a"的内容
String values = "";
for(String str : parser.getTagValues("html/body/div/div/div/div/div/div/a")) {
values = values + str + " ";
}
System.out.println(values);
} catch (Exception e) {
e.printStackTrace();
}
}
}
结果:
百度认证 百度壁纸 百度桌面 百度魔图 百度一键Root 网页 视频 音乐 地图 新闻 图片 词典 常用搜索 hao123 网站导航 百度团购 文库 空间 百科 贴吧 知道 搜藏 经验 百度阅读 百度身边 百度旅游 百度新知 百度相册 百度校园 百度游戏 百度应用 悠洋游戏 移动搜索 掌上百度 手机输入法 百度搜索 百度手机浏览器 百度移动应用 百度手机地图 百度云智能终端平台 百度通讯录 百度网盘 搜索开放平台 站长平