最近在做一个用POI提取excel文件内容的例子。
如果所提取的文件放在网络上。就需要用URL来打开该文件获得InputStream;
URL url = new URL("http://192.168.1.1:8080/resources/电话.xls");
InputStream in = url.openStream();
这样会报错
如果
URL url = new URL("http://192.168.1.1:8080/resources/1.xls");
InputStream in = url.openStream();
就不会有问题。
我用的服务器是Tomcat。
程序测试时的源码
URL url = new URL("http://192.168.1.110:8080/resources/电话.xls");
InputStream in = url.openStream();
POIFSFileSystem pfs = new POIFSFileSystem(in);
HSSFWorkbook wb = new HSSFWorkbook(pfs);
ExcelExtractor extractor = new ExcelExtractor(wb);
extractor.setFormulasNotResults(true);
extractor.setIncludeSheetNames(false);
String text = extractor.getText();
System.out.println(text);
如果所提取的文件放在网络上。就需要用URL来打开该文件获得InputStream;
URL url = new URL("http://192.168.1.1:8080/resources/电话.xls");
InputStream in = url.openStream();
这样会报错
如果
URL url = new URL("http://192.168.1.1:8080/resources/1.xls");
InputStream in = url.openStream();
就不会有问题。
我用的服务器是Tomcat。
程序测试时的源码
URL url = new URL("http://192.168.1.110:8080/resources/电话.xls");
InputStream in = url.openStream();
POIFSFileSystem pfs = new POIFSFileSystem(in);
HSSFWorkbook wb = new HSSFWorkbook(pfs);
ExcelExtractor extractor = new ExcelExtractor(wb);
extractor.setFormulasNotResults(true);
extractor.setIncludeSheetNames(false);
String text = extractor.getText();
System.out.println(text);
经过在论坛上发帖子,各路高手的帮忙,终于解决了这个问题,等知道答案后觉得这个挺简单的
只要写一个类 把URL中的中文转码就行了
package gameover; import java.io.UnsupportedEncodingException; import java.net.URLEncoder; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * 正则替换字符串里面的汉字部分。 * * @author gameover */ public class URLEncoderHZ { public static void main(String[] args) throws Exception { String str = " http://192.168.1.1:8080/resources/电话.xls " ; System.out.println(encode(str, " UTF-8 " )); } private static String zhPattern = " [/u4e00-/u9fa5]+ " ; /** * 替换字符串卷 * * @param str 被替换的字符串 * @param charset 字符集 * @return 替换好的 * @throws UnsupportedEncodingException 不支持的字符集 */ public static String encode(String str, String charset) throws UnsupportedEncodingException { Pattern p = Pattern.compile(zhPattern); Matcher m = p.matcher(str); StringBuffer b = new StringBuffer(); while (m.find()) { m.appendReplacement(b, URLEncoder.encode(m.group( 0 ), charset)); } m.appendTail(b); return b.toString(); } }
比如例子中的urlhttp://192.168.1.1:8080/resources/电话.xls
经过这个类中的方法转成utf-8编码后就变成了http://192.168.1.1:8080/resources/%E7%94%B5%E8%AF%9D.xls当然也可以根据需要转成其他编码格式。这样就可以放心的使用url.openstream这个方法的得到InputStream对象了不会再报错文件找不到。