刚来公司实习,接到的第一个任务,是把一个项目中的中文,全部换成英文。这个项目是公司几年前做的,没有用到国际化,换起来相当麻烦。本来我想手工改改算了,改了一个半小时,才发现项目之巨大,JSP页面共有几百个,手工不可能完成任务。于是想到写个程序来做,毕竟曾经也学过一天的I/O。
于是就有了以下代码。我用的JDK是1.6的,1.5的应该也没问题,再低了就跑不起来了
主要是这个工具类:
package com.hc;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileFilter;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
public class Util {
// 判断一个unicode码是不是中文
public static boolean isChinese(int charInt) {
if (charInt > 19967 && charInt < 40870) {
return true;
} else {
return false;
}
}
// 字节流转换成字符流,同时转换编码
public static BufferedReader changeEncoding(File file)
throws FileNotFoundException, UnsupportedEncodingException {
FileInputStream fin = new FileInputStream(file);
InputStreamReader in = new InputStreamReader(fin, "gb2312");
BufferedReader br = new BufferedReader(in);
return br;
}
// 得到该文件夹,及其所有子文件夹下的所有目标文件
public static List<File> getAllFiles(File file) {
List<File> valueFiles = new ArrayList<File>();
File[] fs = file.listFiles();
for (int i = 0; i < fs.length; i++) {
if (fs[i].isDirectory()) {
// 递归得到每个子文件夹下的目标文件
valueFiles.addAll(getAllFiles(fs[i]));
}
}
// 把file文件夹下的目标文件放进去
valueFiles.addAll(Arrays.asList(getFiles(file)));
return valueFiles;
}
// 得到一个文件夹下的目标文件,不包括子文件夹
private static File[] getFiles(File file) {
// 图个方便,用匿名类了
FileFilter filter = new FileFilter() {
String regex = "\\w*\\.jsp";
public boolean accept(File pathname) {
return pathname.getName().matches(regex);// 文件后缀为.jsp
}
};
File[] fs = file.listFiles(filter);
return fs;
}
// 提取某一文件中的所有中文
public static List<String> getChinese(File file) {
try {
List<String> valueList = new ArrayList<String>();
BufferedReader charArrayReader = Util.changeEncoding(file);
int i = -1;
StringBuilder sBuilder = new StringBuilder();
do {
i = charArrayReader.read();
// System.out.print((char)i);
// 如果是中文
if (Util.isChinese(i)) {
sBuilder.append((char) i);
}
// 如果不是中 文
else {
// 如果是中文 后的第一个
if (sBuilder.length() > 0) {
// 把中文加进去
valueList.add(sBuilder.toString());
// 清除Builder里面的中文
sBuilder.delete(0, sBuilder.length());
}
// 如果不是中文的结束,什么都不用做
}
} while (i != -1);
System.out.println(valueList.size());
return valueList;
} catch (Exception e) {
// 不做异常处理
return null;
}
}
}
下面是调用:
package com.hc;
import java.io.File;
import java.util.ArrayList;
import java.util.List;
public class Test {
public static void main(String[] args) {
// 该文件夹下的所有目标文件
File file = new File("E:/FirstWork/rgsZS/webcontext/");
// 得到所有目标文件
List<File> fileList = Util.getAllFiles(file);
System.out.println("共有JSP文件:" + fileList.size() + "个");
// 提取所有文件中的中文
List<String> strList = new ArrayList<String>();
for (File file2 : fileList) {
strList.addAll(Util.getChinese(file2));
}
//把提取出来的中文打出来
for (String string : strList) {
System.out.println(string);
}
}
}