功能齐全的html页面标签解析工具,可以根据不同的Tag解析;
使用比较方便,下载后解压,我今天只研究了解析,所以只用到htmlparser.jar包。
例如我想解析出一段数据中的图片链接,代码如下:
[code]
String[] arg = { url };
Parser parser;
try {
parser = new Parser(arg[0]);
NodeClassFilter imageTagFilter = new NodeClassFilter(ImageTag.class);
NodeList imgTagList = parser.parse(imageTagFilter);
int imgTagSize = imgTagList.size();
String[] imgTemp = new String[imgTagSize];
for (int i = 0; i < imgTagSize; i++) {
ImageTag imgTag = (ImageTag) imgTagList.elementAt(i);
String src = imgTag.getAttribute(SRC);
imgTemp[i] = src;
}
// this.setImgList(imgTemp);
} catch (ParserException e) {
e.printStackTrace();
}
[/code]
imageTagFilter 为设置的要解析的Tag
imgTagList 为符合条件的节点,包括节点中嵌套的子节点
使用比较方便,下载后解压,我今天只研究了解析,所以只用到htmlparser.jar包。
例如我想解析出一段数据中的图片链接,代码如下:
[code]
String[] arg = { url };
Parser parser;
try {
parser = new Parser(arg[0]);
NodeClassFilter imageTagFilter = new NodeClassFilter(ImageTag.class);
NodeList imgTagList = parser.parse(imageTagFilter);
int imgTagSize = imgTagList.size();
String[] imgTemp = new String[imgTagSize];
for (int i = 0; i < imgTagSize; i++) {
ImageTag imgTag = (ImageTag) imgTagList.elementAt(i);
String src = imgTag.getAttribute(SRC);
imgTemp[i] = src;
}
// this.setImgList(imgTemp);
} catch (ParserException e) {
e.printStackTrace();
}
[/code]
imageTagFilter 为设置的要解析的Tag
imgTagList 为符合条件的节点,包括节点中嵌套的子节点