html文件转换成xml,操作将HTML文件转成XML文件的类

package com.zf.s12;//创建一个包

import java.io.BufferedInputStream;//引入类

import java.io.FileOutputStream;

import java.io.FileWriter;

import java.io.PrintWriter;

import java.net.URL;

import org.w3c.tidy.Tidy;

public class TextHTMLToXML {//操作将HTML文件转成XML文件的类

private String url;//HTML网页地址

private String outFileName;//xml文件所在路径

private String errOutFileName;//错误信息文件所在路径

public TextHTMLToXML(String url,String outFileName,String errOutFileName){

this.url=url;

this.outFileName=outFileName;

this.errOutFileName=errOutFileName;

}

public void convert(){//转换方法

URL u;

BufferedInputStream in;

FileOutputStream out;

Tidy tidy=new Tidy();

tidy.setXmlOut(true);//通知Tidy将HTML转成XML

try {

//将错误信息保存到文件中

tidy.setErrout(new PrintWriter(new FileWriter(errOutFileName),true));

u=new URL(url);//根据网址创建URL对象

in=new BufferedInputStream(u.openStream());//创建缓存输入流

out=new FileOutputStream(outFileName);//创建文件输出流

tidy.parse(in,out);//转换文件

in.close();//释放资源

out.close();//释放资源

} catch (Exception e) {

System.out.println(e.getMessage());

}

}

public static void main(String []args){//java程序主入口处

String htmlFile="

http://localhost:8080/Demo/index.jsp";   String xmlFile="F:/poem.xml";   String errorFile="F:/error.txt";   TextHTMLToXML htmlToXml=new TextHTMLToXML(htmlFile,xmlFile,errorFile);//带参数实例化对象   htmlToXml.convert();//调用方法进行转换   System.out.println("HTML文件转换成XML文件结束");  } }

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值