1.JTidy 用JTidy转换HTML为XML http://blog.csdn.net/tudopi/article/details/4946093 2.NekoHTML 一个使用NekoHTML解析html的例子 http://itindex.net/blog/2007/06/04/1180954475432.html