package switchCodeType;
import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
//Unicode、UTF-8、GBK三种编码的解码,随便扔一个经过编码的字符串,都可以正确解码
//攻破的小技术:如何判断一个字符串是乱码
//注意:乱码通常是以?? 显示的,但是这不是真正意义上的符号?,所以用String.matches("?")来判断是不行的
//2013年11月12日
public class Decode {
public static void main(String[] args) throws Exception{
//要解码的内容
String str = "%5B";
Decode(str);//方法名和所在类名可以一样
}
public static void Decode(String str){
String[] codeType = {"unicode", "UTF-8", "GBK"};
String tmp;
for(String type:codeType){
try {
tmp = URLDecoder.decode(str, type);
if(!isMessyCode(tmp)){//这里用到了多态,String->CharSequence
System.out.println(tmp);
System.out.println(type);
return;
}
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
//暂时狭义的定义非乱码:除了标点符号、数字、字母、汉字,不含其他的
public static boolean isMessyCode(String str){
String regex = "[\\pP\\p{Alpha}\\p{Digit}\u4E00-\u9FA5]*";
if(str.matches(regex)){
return false;
}
return true;
}
}