java utf-8编码后判断字符串长度_Java经典算法:UTF-8验证

根据以下规则,UTF8中的字符长度可以为1到4个字节:

对于1字节字符,第一位为0,后跟其unicode码。

对于n字节字符,前n位全为1,n + 1位为0,其后为n-1个字节,其中最高有效2位为10。

这是UTF-8编码的工作方式:

字符。数字范围| UTF-8字节序列

(十六进制)| (二进制)

-------------------- + ----------------------------- ----------------

0000 0000-0000 007F | 0xxxxxxx

0000 0080-0000 07FF | 110xxxxx 10xxxxxx

0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx

0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

给定表示数据的整数数组,请返回其是否为有效的utf-8编码。

Java解决方案

public boolean validUtf8(int[] data) {

int i=0;

int count=0;

while(i

int v = data[i];

if(count==0){

if((v&240)==240 && (v&248)==240){

count=3;

}else if(((v&224)==224) && (v&240)==224){

count=2;

}else if((v&192)==192 && (v&224)==192){

count=1;

}else if((v|127)==127){

count=0;

}else{

return false;

}

}else{

if((v&128)==128 && (v&192)==128){

count--;

}else{

return false;

}

}

i++;

}

return count==0;}

最后,开发这么多年我也总结了一套学习Java的资料与面试题,如果你在技术上面想提升自己的话,可以关注我,私信发送领取资料或者在评论区留下自己的联系方式,有时间记得帮我点下转发让跟多的人看到哦。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值