做一个软件,需要解析HTML,找到了nekohtml这个工具,网上给的例子如下:packagecom.ctlok.pro;importjava.io.IOException;importorg.cyberneko.html.parsers.DOMParser;importorg.do...
做一个软件,需要解析HTML,找到了nekohtml这个工具,网上给的例子如下:
package com.ctlok.pro;
import java.io.IOException;
import org.cyberneko.html.parsers.DOMParser;
import org.dom4j.Document;
import org.dom4j.Node;
import org.dom4j.io.DOMReader;
import org.xml.sax.SAXException;
publicclassMain{
/**
* @param args
*/
publicstaticvoid main(String[] args){
try{
String url ="http://hk.finance.yahoo.com/q?s=0005.HK";
DOMParser parser =newDOMParser();
parser.parse(url);
org.w3c.dom.Document document = parser.getDocument();
DOMReader domReader =newDOMReader();