字符编码(ASCII、GBK、UTF-8、ANSI)详解

本文详细介绍了字符编码的历史和发展,包括ASCII码、GB2312、GBK、GB18030、Big5、Unicode以及UTF-8等编码方式。重点讲解了各种编码的特点,如ASCII的1字节编码,GBK和GB18030的中文扩展,Unicode的国际标准,以及UTF-8的变长编码和对ASCII的兼容性。在Java中,源代码使用Unicode,而编译后的字节码文件通常采用UTF-8编码。
摘要由CSDN通过智能技术生成

一、ASCII

ASCII (American Standard Code for Information Interchange) - 美国信息交换标准代码

由于计算机最初只支持英文,最先出现的字符编码:ASCII 码。

ASCII 码采用 1 个字节编码,共定义了128个字符。
在这里插入图片描述

二、GB2312、GBK、GB18030、Big5

随着计算机的不断发展,支持简体中文的字符集包括:GB2312 、GBK 、GB18030、Big5(繁体)。

中文一般使用 2 个字节编码,字符编码集容量大小: GB2312 < GBK < GB18030。

1、GB2312

规定中文占 2 个字节,小于 127 的编码按 ASCII 标准解释字符,当 2 个大于 127 的字符连在一起时,表示 1 个汉字。
在这里插入图片描述
2、GBK

规定对收录的每个字符采用 2 个字节表示,对于 ASCII 中的字符占 1 个字节。

3、GB18030

在 GBK 的标准上不断扩展字符,GB18030 的编码使用 4 个字节,兼容 GBK、GB2312 及 ASCII 标准。

即便使用 GB18

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值