java html2mhtcompiler_使用java将网页保存为mht格式(1)

这是一个Java实现的工具类,能够将网页内容转换并保存为MHT格式。通过JQuery获取HTML文本,然后使用Html2MHTCompiler进行编译,支持指定网页地址、编码和本地文件名。
摘要由CSDN通过智能技术生成

使用java将网页保存为mht格式(1)

2009年1月5日来源:233网校网校课程 在线题库评论

分享到

package com.tag;

import java.io.BufferedInputStream;

import java.io.BufferedOutputStream;

import java.io.BufferedReader;

import java.io.ByteArrayInputStream;

import java.io.DataOutputStream;

import java.io.File;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.FileWriter;

import java.io.IOException;

import java.io.InputStream;

import java.io.InputStreamReader;

import java.io.OutputStream;

import java.io.Reader;

import java.net.MalformedURLException;

import java.net.URL;

import java.util.*;

import org.htmlparser.Parser;

import org.htmlparser.Tag;

import org.htmlparser.filters.TagNameFilter;

import org.htmlparser.lexer.Lexer;

import org.htmlparser.lexer.Page;

import org.htmlparser.util.DefaultParserFeedback;

import org.htmlparser.util.NodeList;

import org.htmlparser.util.ParserException;

import toptrack.tools.JQuery;

import javax.activation.DataHandler;

import javax.activation.DataSource;

import javax.activation.MimetypesFileTypeMap;

import javax.mail.Message;

import javax.mail.MessagingException;

import javax.mail.Multipart;

import javax.mail.Session;

import javax.mail.internet.InternetAddress;

import javax.mail.internet.MimeBodyPart;

import javax.mail.internet.MimeMessage;

import javax.mail.internet.MimeMultipart;

import javax.mail.internet.MimePartDataSource;

/**

* mht文件解析类

* @author examda

*/

public class Html2MHTCompiler {

private URL strWeb = null; /**网页地址*/

private String strText = null; /**网页文本内容*/

private String strFileName = null; /**本地文件名*/

private String strEncoding = null; /**网页编码*/

//mht格式附加信息

private String from = "dongle2001@126.com";

private String to;

private String subject = "mht compile";

private String cc;

private String bcc;

private String smtp = "localhost";

public static void main(String[] args) {

String strUrl = "//www.mtime.com/my/tropicofcancer/blog/843555/";

String strEncoding = "utf-8";

String strText = JQuery.getHtmlText(strUrl, strEncoding, null);

if (strText == null)

return;

Html2MHTCompiler h2t = new Html2MHTCompiler(strText, strUrl, strEncoding, "test.mht");

h2t.compile();

//Html2MHTCompiler.mht2html("test.mht", "a.html");

}

/**

*方法说明:初始化

*输入参数:strText 网页文本内容; strUrl 网页地址; strEncoding 网页编码; strFileName 本地文件名

*返回类型:

*/

public Html2MHTCompiler(String strText, String strUrl, String strEncoding, String strFileName) {

// TODO Auto-generated constructor stub

try {

strWeb = new URL(strUrl);

} catch (MalformedURLException e) {

// TODO Auto-generated catch block

e.printStackTrace();

return;

}

this.strText = strText;

this.strEncoding = strEncoding;

this.strFileName = strFileName;

}

/**

*方法说明:执行下载操作

*输入参数:

*返回类型:

*/

分享到:

责编:zj评论

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值