java学习
zeh2007
这个作者很懒,什么都没留下…
展开
-
java解析xml之一:使用SAX与DOM
一.概要 用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM。Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。 ...2007-09-01 17:29:44 · 115 阅读 · 0 评论 -
java解析xml之二:使用JDOM
一.简介 JDOM是一种解析XML的Java工具包。 它由Breet Mclaughlin和Jason Hunter在2000年初作为一个开放源代码项目正式开始研发。DOM适合于当今流行的各种语言,包括Java,JavaScripte,VB,VBScript,Perl,C,C++等。它了为HTML和XML文档提供了一个可应用于不同平台的编程接口。 DOM的设计为了适用于不同的语言,它保留了...2007-09-01 21:49:50 · 107 阅读 · 0 评论 -
java解析xml之三:使用domj4
一.简介 DOM4J是dom4j.org出品的一个开源XML解析包。Dom4j是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。DOM4J最大的特色是使用大量的接口,这也是它被认为比JDOM灵活的主要原因。 二.安装dom4j 1.下载dom4j:http://sourceforge.net/proje...2007-09-01 22:06:00 · 447 阅读 · 0 评论 -
java获取网页主信息之一:html树操作
1.节点操作 package Source; //html树节点类 public class Node { //构造方法 public Node() { content = ""; hasC...2007-09-01 22:17:37 · 133 阅读 · 0 评论 -
java获取网页主信息之二:辅助操作
1.栈操作 package Source; import java.util.LinkedList; //用List定义一个栈 public class Stack { //构造方法 public Stack() { ...2007-09-01 22:19:52 · 112 阅读 · 0 评论 -
java获取网页主信息之三:html to tree
对html文件进行扫描,将html元素抽象出来形成树。 package Source; import java.io.*; public class HTML2Tree { //构造方法 public HTML2Tree() ...2007-09-01 22:22:00 · 122 阅读 · 0 评论 -
java获取网页主信息之四:抽取信息块
从已经建立完成的html树中抽取主信息。 package Source; public class ChooseBlock { //构造方法,设置允许错误率 public ChooseBlock(double th) { threshold = t...2007-09-01 22:24:43 · 217 阅读 · 0 评论 -
java获取网页主信息之五:测试
1.所需文件 param.txt:存放需要提取信息的网页路径 TestPage:存放需要提取信息的网页 Out.txt:输出的网页内容 2.测试程序 package test; import java.io.*; import Source.*; //提取页面主要信息测试 public clas...2007-09-01 22:29:27 · 124 阅读 · 0 评论