varchar汉字占几个字符_常用字符编码介绍

在百度百科中,是这样定义的,字符编码(Character encoding)也叫字符码,是把中的为指定中某一(例如:模式、、8位组或者),以便在中存储和通过的传递。实际上就就记住一句话,字符编码就是为了方便信息存储和传递。

常用编码:

ASCII:表示英语及西欧语言,占1bytes,基本的ASCII字符集共有128个字符,其中96个可打印字符,适用于不同地区的扩充的ASCII字符集,扩充字符的编码均为高位为1的8位代码,即128-255,也称为扩展ASCII码。

linux查看ASCII命令:

man ascii(#centos中需要安装man-pages)

5ca63e2c61ebe2fd8bff4e943ee51967.png

GB2312:简体中文字符集,兼容ASCII,占2bytes,由于我们汉字比较复杂,又不能和ASCII编码冲突,所以,中国制定了GB2312编码,并且需要两个字节。

Unicode:国际标准组织统一标准字符集,占2bytes,简单的说是为了解决不同编码兼容性问题,就是在不同的字符集下,怎么正常显示不同的字符集。就是将世界上所有的符号都纳入其中,无论中文、英文、日文等,这样就不会出现乱码了,这就是Unicode编码。

GBK:GB2312的扩展字符集,支持繁体字,兼容GB2312,占2bytes,由于汉字太多,太复杂,GB2312无法处理所有的汉字,这就出现GBK字符集,它扩展了GB2312编码,加入了更多的汉字。

UTF-8:不定长编码,占1-3bytes,它的出现是为了提高Unicode编码的效率,根据不同符号自动选择编码的长短。

这些是我们常用的字符编码,还有很多我们不怎么常用的,比如:Big5、MBCS、Base64、UTF-16等等。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值