package test;
import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 正则替换字符串里面的汉字部分。
*
*/
public class URLEncoderHZ {
public static void main(String[] args) throws Exception {
String str = "http://192.168.1.1:8080/resources/电话.xls";
System.out.println(encode(str, "UTF-8"));
}
private static String zhPattern = "[\\u4e00-\\u9fa5]";
/**
* 替换字符串卷
*
* @param str 被替换的字符串
* @param charset 字符集
* @return 替换好的
* @throws UnsupportedEncodingException 不支持的字符集
*/
public static String encode(String str, String charset) throws UnsupportedEncodingException {
Pattern p = Pattern.compile(zhPattern);
Matcher m = p.matcher(str);
StringBuffer b = new StringBuffer();
while (m.find()) {
m.appendReplacement(b, URLEncoder.encode(m.group(0), charset));
}
m.appendTail(b);
return b.toString();
}
}
最近在做一个用POI提取excel文件内容的例子。
如果所提取的文件放在网络上。就需要用URL来打开该文件获得InputStream;
URL url = new URL("http://192.168.1.1:8080/resources/电话.xls");
InputStream in = url.openStream();
这样会报错
如果
URL url = new URL("http://192.168.1.1:8080/resources/1.xls");
InputStream in = url.openStream();
就不会有问题。
我用的服务器是Tomcat。
程序测试时的源码
URL url = new URL("http://192.168.1.110:8080/resources/电话.xls");
InputStream in = url.openStream();
POIFSFileSystem pfs = new POIFSFileSystem(in);
HSSFWorkbook wb = new HSSFWorkbook(pfs);
ExcelExtractor extractor = new ExcelExtractor(wb);
extractor.setFormulasNotResults(true);
extractor.setIncludeSheetNames(false);
String text = extractor.getText();
System.out.println(text);
经过在论坛上发帖子,各路高手的帮忙,终于解决了这个问题,等知道答案后觉得这个挺简单的
只要写一个类 把URL中的中文转码就行了