一个汉字几个字符长度_细说一个汉字等于几个字符,以及汉字,字符,字节,位之间的关系 - 哈哈呵h...

     一:
1个汉字 = 1个字 = 1个字符

     二:
1个字符 = 1个字节 = 8bit(ACSII码下)

     三:
1个字符 = 2个字节 = 16bit(Unicode码下)

以前一直使用oracle11g,一个汉字占3个字节,所以在操作MySQL时也一直这样分配长度。

今天测试了下mysql发现不对了

935829798eec80f90158ec2001ca1a14.png686dbad6b05f7deb0c49c4ee7542c899.png

可以看到第一个的长度确实是15,但是第二个为什么是5?

在网上找到资料:char_length计算的是字符长度,而length计算的是字节长度,刚好我使用的是utf8,一个汉字占3个字节,占一个字符。

那好了,应该是对的上了,可是好奇心我就试了下

0cf9425780347b96ca795308d0929c98.png52ec7c85cdc07562110f87ecbda07975.png

为什么这是相同的?因为这不是汉字,一个字母一个字符一个字节。

好了,现在知道原来mysql和Oracle一样的,但是又看到一篇说mysql的varchar与oracle的varchar2是不一样的,前者是用字符做单位的,后者是用字节做单位的。对于oracle11g的varchar2是用字节做单位的在以前玩oracle时测试过,但是mysql就没有测试过,好吧现在测试下。我先将字段长度改小看下能不能给容下,测试结果确实是可以的,证明mysql的varchar是用字符做单位的,这里就不贴图了,大家可以自己验证下。

总结:oracle 中varchar2(10)  既10个字节3个汉字

            mysql  中varchar(10) 既10个字符10个汉字

所以现在可以将mysql的varchar字段减小1/3了,性能也能提高哦。

问题1:一个中文字符用utf-8编码占用几个字节,gbk,gb2312,还有iso8859-1呢?

答案1:常用中文字符用utf-8编码占用3个字节(大约2万多字),

但超大字符集中的更大多数汉字要占4个字节(在unicode编码体系中,U+20000开始有5万多汉字)。
GBK、GB2312收编的汉字占2个字节,严格地用iso8859-1无法表示汉字,只能转为问号。

汉字一个字占两个字节。英文字母一个字母占一个字节

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值