字符编码(ASCII、GBK、UTF-8、ANSI)详解

一、ASCII

ASCII (American Standard Code for Information Interchange) - 美国信息交换标准代码

由于计算机最初只支持英文,最先出现的字符编码:ASCII 码。

ASCII 码采用 1 个字节编码,共定义了128个字符。
在这里插入图片描述

二、GB2312、GBK、GB18030、Big5

随着计算机的不断发展,支持简体中文的字符集包括:GB2312 、GBK 、GB18030、Big5(繁体)。

中文一般使用 2 个字节编码,字符编码集容量大小: GB2312 < GBK < GB18030。

1、GB2312

规定中文占 2 个字节,小于 127 的编码按 ASCII 标准解释字符,当 2 个大于 127 的字符连在一起时,表示 1 个汉字。
在这里插入图片描述
2、GBK

规定对收录的每个字符采用 2 个字节表示,对于 ASCII 中的字符占 1 个字节。

3、GB18030

在 GBK 的标准上不断扩展字符,GB18030 的编码使用 4 个字节,兼容 GBK、GB2312 及 ASCII 标准。

即便使用 GB18

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值