java中如何计算一个字符串的byte长度(一个汉字多少字符)

 中文并不一定是占两个字节的,具体占多少字节是跟具体的编码方式相关的。
比如说:GB2312、GBK、GB18030 编码是占用两个字节的,但是 UTF-8 编码的话至少需要占用三个字节。
有一个简单方法,就是把大于 0xff 的字符都作为两个字符(当然是在 GBK 环境下)

Java code
   
   
public static int count(String str) { if (str == null || str.length == 0 ) { return 0 ; } int count = 0 ; char [] chs = str.toCharArray(); for ( int i = 0 ; i < chs.length; i ++ ) { count += (chs[i] > 0xff ) ? 2 : 1 ; } return count; }



或者你直接使用 int len = str.getBytes("gbk");

上面代码假设你的数据库编码格式是 GBK 的,而不是 UTF-8 的,如果是 UTF-8 的话,上面的代码无效!

1字节等于8比特,一个字母是1字节,而一个汉字要用2个字节。

一个汉字=2个字符

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值