判断一个字符串编码是utf-8还是gbk

java代码:

    private static boolean Isutf8orgb2312(int[] value){

        int iGBK = CountGBK(value);

        android.util.Log.e(TAG,"iGBK="+iGBK);
        int iUTF8 = CountUTF8(value);
        android.util.Log.e(TAG,"iUTF8="+iUTF8);
        if (iUTF8 > iGBK)
            return false;
        return true;
    }

    private static int CountGBK(int[] arrayData){
        int counter = 0;
        for (int i=0; i<arrayData.length-1; i++) {
            if(((byte)arrayData[i] & 0x80) == 0) continue;
            if (arrayData[i] >= 161 && arrayData[i] <= 247 && arrayData[i+1]>=161 && arrayData[i+1] <= 254){
                counter+= 2;
                i++;
            }
        }
        return counter;
    }


    private static int CountUTF8(int[] arrayData) {
        int counter = 0;
        int head = 0x80;
        for (int i = 0; i < arrayData.length; i++) {
            if (((byte) arrayData[i] & 0x80) == 0)
                continue;
            int tmpHead = head;
            int wordLen = 0, tPos = 0;
            while ((arrayData[i] & tmpHead) > 0) {
                ++wordLen;
                tmpHead >>= 1;
            }
            android.util.Log.e(TAG,"wordLen="+wordLen);
            if (wordLen <= 1)
                continue; // utf8最小长度为2
            wordLen--;
            if (wordLen + i >= arrayData.length)
                break;
            for (tPos = 1; tPos <= wordLen; ++tPos) {
                byte secondChar = (byte) arrayData[i + tPos];
                if ((secondChar & head) == 0)
                    break;
            }
            if (tPos > wordLen) {
                android.util.Log.e(TAG,"wordLenxxx="+wordLen);
                counter += wordLen + 1;
                i += wordLen;
            }
        }
        return counter;
    }

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值