java utf-8 解码_java解码任意编码过的字符串(unicode、utf-8、gbk)

package switchCodeType;

import java.io.UnsupportedEncodingException;

import java.net.URLDecoder;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

//Unicode、UTF-8、GBK三种编码的解码,随便扔一个经过编码的字符串,都可以正确解码

//攻破的小技术:如何判断一个字符串是乱码

//注意:乱码通常是以?? 显示的,但是这不是真正意义上的符号?,所以用String.matches("?")来判断是不行的

//2013年11月12日

public class Decode {

public static void main(String[] args) throws Exception{

//要解码的内容

String str = "%5B";

Decode(str);//方法名和所在类名可以一样

}

public static void Decode(String str){

String[] codeType = {"unicode", "UTF-8", "GBK"};

String tmp;

for(String type:codeType){

try {

tmp = URLDecoder.decode(str, type);

if(!isMessyCode(tmp)){//这里用到了多态,String->CharSequence

System.out.println(tmp);

System.out.println(type);

return;

}

} catch (UnsupportedEncodingException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

}

//暂时狭义的定义非乱码:除了标点符号、数字、字母、汉字,不含其他的

public static boolean isMessyCode(String str){

String regex = "[\\pP\\p{Alpha}\\p{Digit}\u4E00-\u9FA5]*";

if(str.matches(regex)){

return false;

}

return true;

}

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值