几种判断字符集编码的方法(Java) .未完

最新推荐文章于 2023-01-09 16:31:34 发布

zzcv_

最新推荐文章于 2023-01-09 16:31:34 发布

阅读量1.2w

点赞数

分类专栏： Java 文章标签： java byte string null 平台

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzcv_/article/details/2075077

版权

Java 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1.通过把未知编码字符串,用猜想的编码再解码,观察字符串是不是正确还原了。
原理:假如目标编码没有数组中的字符,那么编码会破坏,无法还原。
缺点:假如字符少,而正巧错误的猜想编码中有这种字节,就会出错。

如:new String("tested str".getBytes("enc"),"enc")

2.大多数时候,我们只要判断本地平台编码和utf8,utf8编码相当有规律,所以可以分析是否是utf9,否则使用本地编码。
原理:分析byte[]来判断规律。
缺点:有时,个别本地编码字节在utf8中也会出现,导致出错,需要分析。

如转贴得函数:

public static boolean isValidUtf8( byte [] b, int aMaxCount) {

int lLen=b.length,lCharCount=0;

for(int i=0;i

byte lByte=b[i++];//to fast operation, ++ now, ready for the following for(;;)

if(lByte>=0) continue;//>=0 is normal ascii

if(lByte<(byte)0xc0 || lByte>(byte)0xfd) return false;

int lCount=lByte>(byte)0xfc?5:lByte>(byte)0xf8?4

:lByte>(byte)0xf0?3:lByte>(byte)0xe0?2:1;

if(i+lCount>lLen) return false;

for(int j=0;j=(byte)0xc0) return false;

}

return true ;

}

相应地，一个使用上述方法的例子如下：

public static String getUrlParam(String aStr,String aDefaultCharset)

throws UnsupportedEncodingException {

if(aStr==null) return null;

byte[] lBytes=aStr.getBytes("ISO-8859-1");

return new String(lBytes,StringUtil.isValidUtf8(lBytes)?"utf8":aDefaultCharset);

}

3.按编码规则,一字字比照。
优点是错物更少,缺点是太费资源。

字符检测类如下:http://dev.csdn.net/Develop/article/10/10961.shtm

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zzcv_ CSDN认证博客专家 CSDN认证企业博客

码龄18年

36: 原创

25万+: 周排名

150万+: 总排名

24万+: 访问

: 等级

2487: 积分

16: 粉丝

14: 获赞

35: 评论

19: 收藏

私信

关注

热门文章

分类专栏

ASP/Asp.net 1篇
Java 8篇
JavaScript/XML/Dom 8篇
Linux 4篇
SQL 12篇
网络 1篇

最新评论

MySQL的编码转换，乱码处理例一
普通网友: 码住，求博主联系方式，我的微信cto51shequ，在线等回复
Linux常用简单命令
qq_21926275: 学习了，多谢！
svg格式的中国地图轮廓图,用cd画的,有需要的拿
zzcv_ 回复 Andrewlxt: 连接线段的点
svg格式的中国地图轮廓图,用cd画的,有需要的拿
Andrewlxt: 我想知道以下内容是什么意思。我知道是画地图的，但是比方每个数字是个点么，拐弯之类的... <path id="_138475496" class="fil5" d="M166.455 151.677c-1.6638,-1.2834 -2.8577,-1.2004 -4.2339,-1.1319 -0.2819,0.129 -0.6464,0.2435 -1.1127,0.3379 -1.1116,1.641 -0.5293,3.5467 0.4235,5.6112 0.053,0.8469 0.2118,1.6939 -0.1058,2.8585 -0.847,0 -1.694,0 -2.541,0 -0.8469,0.4235 -0.5293,0.3705 -0.6881,1.4293 0.3176,0.2117 0.6881,0.4764 1.0587,0.7411 0,0.2646 0,0.5293 0,0.794 -0.2117,0.4764 -0.3706,1.0058 -0.5294,1.5351 -1.2704,0 -1.588,0.5823 -2.435,0.847 -0.9529,0 -1.9057,0.0529
svg格式的中国地图轮廓图,用cd画的,有需要的拿
那种感觉: 但愿你今天上了csdn，可以加下qq详细说下么？cd我不会，我下好了，但是不知道怎么把轮廓的数据导出来！谢谢！

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。