★GBK、ASCII、UTF-8.. 编码大全

最新推荐文章于 2025-03-12 10:17:35 发布

好逸爱劳

最新推荐文章于 2025-03-12 10:17:35 发布

阅读量4.8k

点赞数 5

分类专栏：编码文章标签：编码学

本文链接：https://blog.csdn.net/weixin_44685869/article/details/104230122

版权

编码专栏收录该内容

1 篇文章

订阅专栏

编码（信息交换标准代码）

编码的由来：

在计算机中，所有的数据在存储和运算时都要使用二进制数表示（因为计算机用高电平和低电平分别表示 1 和 0 ）。

例如，像 a、b、c、d 这样的 52 个字母（包括大写）以及 0、1 等数字还有一些常用的符号（例如*、#、@等）在计算机中存储时也要使用二进制数来表示。
具体用哪些二进制数字表示哪个对应的符号，每个人都可以约定自己的一套（这就叫编码）。而大家如果要想互相通信而不造成混乱，那么大家就必须使用相同的编码规则。

编码格式的介绍：

ASCII码：

它用 7 个二进制位来表示，由于那个时期生产的大多数计算机使用 8 位大小的字节，因此用户不仅可以存放所有可能的ASCII字符，而且有整整一位空余下来。如果你技艺高超，可以将该位用做自己离奇的目的。

ASCII第一次以规范标准的类型发表是在 1967年，最后一次更新则是在 1986年，到目前为止共定义了 128个字符。

作用：表语英语及西欧语言。
位数： ASCII是用 7位表示的，能表示 128个字符；其扩展使用 8位表示，表示 256个字符。
范围： ASCII从00到7F，扩展从00到FF。
一个英文字母（不分大小写）占一个字节的空间，一个中文汉字占两个字节的空间。

ASCII码表

iso8859-1

属于单字节编码，最多能表示的字符范围是0-255，应用于英文系列。比如，字母’a’的编码为0x61=97。

iso8859-1编码表示的字符范围很窄，无法表示中文字符。
由于是单字节编码，和计算机最基础的表示单位一致，所以很多时候，仍旧使用iso8859-1编码来表示。
在很多协议上，默认使用该编码。
虽然 “中文” 两个字不存在iso8859-1编码，以gb2312编码为例，应该是"d6d0 cec4"两个字符，iso8859-1编码的则将它拆开为4个字节来表示：“d6 d0 ce c4”

事实上，在进行存储的时候，也是以字节为单位处理的。而如果是UTF编码，则是6个字节"e4 b8 ad e6 96 87"。很明显，这种表示方法还需要以另一种编码为基础。

作用：扩展ASCII，表示西欧、希腊语等。
位数：8位，
范围：从00到FF，兼容ASCII字符集。
英文一个字节，不支持中文

Unicode编码：

Unicode字符集（简称为UCS），国际标准组织于1984年4月成立 ISO/IEC JTC1/SC2/WG2工作组，针对各国文字、符号进行统一性编码。
1991年美国跨国公司成立Unicode Consortium，并于1991年10月与WG2达成协议，采用同一编码字集。

目前Unicode是采用 16位编码体系，其字符集内容与 ISO10646的BMP（Basic Multilingual Plane）相同。Unicode于1992年6月通过DIS（Draf International Standard）

目前版本V2.0于1996公布，内容包含符号 6811个，汉字 20902个，韩文拼音 11172个，造字区 6400个，保留 20249个，共计 65534个。

Unicode编码后的大小是一样的

例如 一个英文字母 "a" 和　一个汉字 "好"，编码后都是占用的空间大小是一样的，都是两个字节！

Unicode可以用来表示所有语言的字符，而且是定长双字节（也有四字节的）编码，包括英文字母在内。

所以可以说它是不兼容iso8859-1编码的， 也不兼容任何编码。不过，相对于iso8859-1编码来说，uniocode编码只是在前面增加了一个0字节，比如字母'a'为"00 61"。

定长编码便于计算机处理（注意GB2312/GBK不是定长编码），而unicode又可以用来表示所有字符，所以在很多软件内部是使用unicode编码来处理的，比如java。

UNICODE字符集有多个编码方式，分别是UTF-8，UTF-16，UTF-32和UTF-7编码。

作用：亚美采用同一编码字集。
位数：16位，
范围：符号 6811个，汉字 20902个，韩文拼音 11172个，造字区 6400个，保留 20249个，共计 65534个。
英文中文都占用两个字节，中英各自标点符号也是如此

字节是指一小组相邻的二进制数码。通常是8位作为一个字节。它是构成信息的一个小单位，并作为一个整体来参加操作，比字小，是构成字的单位。

UTF-8:

UTF:UCS Transformation Format.考虑到 unicode编码不兼容iso8859-1编码，而且容易占用更多的空间。
因为对于英文字母，unicode也需要两个字节来表示。所以unicode不便于传输和存储。因此而产生了utf编码。

utf编码兼容iso8859-1编码，同时也可以用来表示所有语言的字符，
utf编码是不定长编码，每一个字符的长度从1-6个字节不等。
另外utf编码自带简单的校验功能。一般来讲，英文字母都是用一个字节表示，而汉字 使用三个字节。

注意，虽然说utf是为了使用更少的空间而使用的，但那只是相对于unicode编码来说，如果已经知道是汉字，则使用GB2312/GBK无疑是最节省的。

不过另一方面，值得说明的是，虽然 utf编码对汉字使用3个字节，但即使对于汉字网页，utf编码也会比 unicode编码节省，因为网页中包含了很多的英文字符。

作用：unicode不便于传输和存储。utf 英文字节少便于传输。满足万恶的资本主义
位数：8位
范围：兼容iso8859-1编码，用来表示所有语言的字符
英文占用一个字节，中文占用三个字节

UTF8编码后的大小是不一定,例如一个英文字母"a" 和　一个汉字 “好”，编码后占用的空间大小就不样了，前者是一个字节，后者是三个字节！编码的方法是从低位到高位。黄色为标志位其它着色为了显示其，编码后的位置。

UTF-8编码规则： 如果只有一个字节则其最高二进制位为0；如果是多字节，其第一个字节从最高位开始，连续的二进制位值为1的个数决定了其编码的字节数，其余各字节均以10开头。UTF-8转换表表示如下：

Unicode/UCS-4	bit数	UTF-8	byte数	备注
0000 ~ 007F	0~7	0XXX XXXX	1
0080 ~ 07FF	8~11	110X XXXX 10XX XXXX	2
0800 ~ FFFF	12~16	1110 XXXX 10XX XXXX 10XX XXXX	3	基本定义范围：0~FFFF
1 0000 ~ 1F FFFF	17~21	1111 0XXX 10XX XXXX 10XX XXXX 10XX XXXX	4	Unicode6.1定义范围：0~10 FFFF
20 0000 ~ 3FF FFFF	22~26	1111 10XX 10XX XXXX 10XX XXXX 10XX XXXX 10XX XXXX	5	说明：此非unicode编码范围，属于UCS-4编码早期的规范UTF-8可以到达6字节序列，可以覆盖到31位元（通用字符集原来的极限）。尽管如此，2003年11月UTF-8被RFC3629重新规范，只能使用原来Unicode定义的区域，U+0000到U+10FFFF。根据规范，这些字节值将无法出现在合法UTF-8序列中
400 0000 ~ 7FFF FFFF	27~31	1111 110X 10XX XXXX 10XX XXXX 10XX XXXX 10XX XXXX 10XX XXXX	6	同上

UTF-16:

采用2 字节，Unicode中不同部分的字符都同样基于现有的标准。

这是为了便于转换。从 0x0000到0x007F是ASCII字符，从0x0080到0x00FF是ISO-8859-1对ASCII的扩展。希腊字母表使用从0x0370到 0x03FF 的代码，斯拉夫语使用从0x0400到0x04FF的代码，美国使用从0x0530到0x058F的代码，希伯来语使用从0x0590到0x05FF的代码。中国、日本和韩国的象形文字（总称为CJK）占用了从0x3000到0x9FFF的代码；

由于0x00在c语言及操作系统文件名等中有特殊意义，故很多情况下需要UTF-8编码保存文本，去掉这个0x00。举例如下：

UTF-16: 0x0080 = 0000 0000 1000 0000
UTF-8: 0xC280 = 1100 0010 1000 0000

UTF-32:

采用4字节。

UTF-7:

A Mail-Safe Transformation Format of Unicode(RFC1642)。这是一种使用 7 位 ASCII 码对 Unicode 码进行转换的编码。
它的设计目的仍然是为了在只能传递 7 为编码的邮件网关中传递信息。

UTF-7 对英语字母、数字和常见符号直接显示，而对其他符号用修正的 Base64 编码。符号 + 和 - 号控制编码过程的开始和暂停。所以乱码中如果夹有英文单词，并且相伴有 + 号和 - 号，这就有可能是 UTF-7 编码。
作用： 为世界650种语言进行统一编码，兼容ISO-8859-1。
位数： UNICODE字符集有多个编码方式，分别是UTF-8，UTF-16和UTF-32。

很多人以为UTF-8等和Unicode都是字符集或都是编码方式，其实这是误区。

MyLover

GB2312-80 （信息交换用汉字编码字符集）标准：

GB2312-80 是 1980 年制定的中国汉字编码国家标准。

共收录 7445个字符，基本集共收入汉字 6763个和非汉字图形字符 682个。
GB2312通常采用 EUC 储存方法，以便兼容于ASCII。浏览器编码表上的“ GB2312 ”，通常都是指“ EUC-CN ”表示法。
每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”（也称“区字节）”，第二个字节称为“低位字节”（也称“位字节”）。

所以 8 位二进制，汉字占2 个字节，16 个二进制。

GB2312 兼容标准 ASCII码，采用扩展 ASCII 码的编码空间进行编码.
一个汉字占用两个字节，每个字节的最高位为 1。
具体办法是：收集了 7445 个字符分成 94 个区，每区有 94 个位。
每一行称为一个 “区”，每一列称为一个“位”，每个区位上只有一个字符，区号位号的范围均为 01-94，
区号和位号组成的代码称为“区位码”。

把换算成十六进制的区位码加上 2020H，就得到国标码。国标码加上 8080H，就得到常用的计算机机内码。

1995年又颁布了《汉字编码扩展规范》（GBK）。GBK与GB 2312—1980国家标准所对应的内码标准兼容，同时在字汇一级支持 ISO/IEC10646—1和GB 13000—1 的全部 中、日、韩（CJK） 汉字，共计 20902 字。

中国大陆几乎所有的中文系统和国际化的软件都支持 GB2312。

作用： 国家简体中文字符集，兼容ASCII。
位数： 使用8位表示，使用2个字节表示，能表示7445个符号，包括6763个汉字，几乎覆盖所有高频率汉字。

范围： 中、日、韩（CJK）汉字，共计 20902 字。

  01-09区为特殊符号。 例：0101 --> 0999

  16-55区为一级汉字，按拼音排序。

  56-87区为二级汉字，按部首/笔画排序。

  10-15区及88-94区则未有编码。

  举例来说，“啊”字是GB2312之中的第一个汉字，它的区位码就是1601。

  将区号和位号分别加上 20H（十六进制），得到的 4 位十六进制整数称为国标码，编码范围为 0x2121～0x7E7E。
  为了兼容标准 ASCII 码，给国标码的每个字节加 80H，形成的编码称为机内码，
  简称内码，是汉字在机器中实际的存储代码 GB2312-80 标准的内码范围是 0xA1A1～0xFEFE。

汉字占2 个字节，英文占用一个（你也可以理解他不支持英文，因为他是将英文当做中文的拼音来看待的）

  GB 2312 标准共收录 6763 个汉字，其中一级汉字 3755 个，二级汉字 3008 个
  GB 2312 收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的 682 个全角字符。

GB 2312 的出现，基本满足了汉字的计算机处理需要，它所收录的汉字已经覆盖中国大陆 99.75% 的使用频率。
对于人名、古汉语等方面出现的罕用字，GB 2312 不能处理，这导致了后来 GBK 及GB 18030汉字字符集的出现。

GB2312简体中文编码表

GBK 编码标准：

《汉字内码扩展规范》(GBK) 于1995年制定

兼容GB2312、GB13000-1、BIG5 编码中的所有汉字，使用双字节编码

编码空间为 0x8140～0xFEFE，共有 23940 个码位，
其中 GBK1 区和 GBK2 区也是 GB2312 的编码范围。收录了 21003 个汉字。

  GBK向下与 GB 2312 编码兼容，向上支持 ISO 10646.1国际标准，是前者向后者过渡过程中的一个承上启下的产物。
  ISO 10646 是国际标准化组织ISO 公布的一个编码标准，即 Universal Multilpe-Octet Coded Character Set（简称UCS）
  大陆译为《通用多八位编码字符集》，台湾译为《广用多八位元编码字元集》，它与 Unicode 组织的Unicode编码完全兼容。
  ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。
  我国 1993 年以 GB 13000.1 国家标准的形式予以认可（即 GB 13000.1 等同于 ISO 10646.1）。

作用：它是GB2312的扩展，加入对繁体字的支持，兼容GB2312。
位数： 使用 2个字节表示，可表示 21886个字符。
范围： 高字节从81到FE，低字节从40到FE。
汉子占用两个字节，英文占用一个字节

GB18030编码标准：

汉字内码扩展规范》(GBK) 于1995年制定

兼容GB2312、GB13000-1、BIG5 编码中的所有汉字，使用双字节编码
编码空间为 0x8140～0xFEFE，共有 23940 个码位，
其中 GBK1 区和 GBK2 区也是 GB2312 的编码范围。
收录了 21003 个汉字。GBK向下与 GB 2312 编码兼容，向上支持 ISO 10646.1国际标准，是前者向后者过渡过程中的一个承上启下的产物。
ISO 10646 是国际标准化组织ISO 公布的一个编码标准，即 Universal Multilpe-Octet Coded Character Set（简称UCS），大陆译为《通用多八位编码字符集》，台湾译为《广用多八位元编码字元集》。
它与 Unicode 组织的Unicode编码完全兼容。ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。我国 1993 年以 GB 13000.1 国家标准的形式予以认可（即 GB 13000.1 等同于 ISO 10646.1）。

转换
1千吉字节(TB, KiloGigaByte) = 1024吉字节 (2的40次方字节)
(1TB = 1024GB)
1吉字节(GB, GigaByte) = 1024兆字节 (2的30次方字节)
(1GB=1024MB)
1兆字节(MB,MegaByte) =1024千字节 (2的20次方字节)
(1MB=1024KB)
1千字节(KB,KiloByte) =1024字节 (2的10次方字节)
1字节(Byte） = 8位(bit)

语言	字符集	正式名称
英语、西欧语	ASCII，ISO-8859-1	MBCS 多字节
简体中文	GB2312	MBCS 多字节
繁体中文	BIG5	MBCS 多字节
简繁中文	GBK	MBCS 多字节
中文、日文及朝鲜语	GB18030	MBCS 多字节
各国语言	UNICODE，UCS	DBCS 宽字节

ASCII码表

Bin(二进制)	Oct (八进制)	Dec (十进制)	Hex (十六进制)	缩写/字符	解释
0000 0000	00	0	0x00	NUL(null)	空字符
0000 0001	01	1	0x01	SOH(start of headline)	标题开始
0000 0010	02	2	0x02	STX (start of text)	正文开始
0000 0011	03	3	0x03	ETX (end of text)	正文结束
0000 0100	04	4	0x04	EOT (end of transmission)	传输结束
0000 0101	05	5	0x05	ENQ (enquiry)	请求
0000 0110	06	6	0x06	ACK (acknowledge)	收到通知
0000 0111	07	7	0x07	BEL (bell)	响铃
0000 1000	010	8	0x08	BS (backspace)	退格
0000 1001	011	9	0x09	HT (horizontal tab)	水平制表符
0000 1010	012	10	0x0A	LF (NL line feed, new line)	换行键
0000 1011	013	11	0x0B	VT (vertical tab)	垂直制表符
0000 1100	014	12	0x0C	FF (NP form feed, new page)	换页键
0000 1101	015	13	0x0D	CR (carriage return)	回车键
0000 1110	016	14	0x0E	SO (shift out)	不用切换
0000 1111	017	15	0x0F	SI (shift in)	启用切换
0001 0000	020	16	0x10	DLE (data link escape)	数据链路转义
0001 0001	021	17	0x11	DC1 (device control 1)	设备控制1
0001 0010	022	18	0x12	DC2 (device control 2)	设备控制2
0001 0011	023	19	0x13	DC3 (device control 3)	设备控制3
0001 0100	024	20	0x14	DC4 (device control 4)	设备控制4
0001 0101	025	21	0x15	NAK (negative acknowledge)	拒绝接收
0001 0110	026	22	0x16	SYN (synchronous idle)	同步空闲
0001 0111	027	23	0x17	ETB (end of trans. block)	结束传输块
0001 1000	030	24	0x18	CAN (cancel)	取消
0001 1001	031	25	0x19	EM (end of medium)	媒介结束
0001 1010	032	26	0x1A	SUB (substitute)	代替
0001 1011	033	27	0x1B	ESC (escape)	换码(溢出)
0001 1100	034	28	0x1C	FS (file separator)	文件分隔符
0001 1101	035	29	0x1D	GS (group separator)	分组符
0001 1110	036	30	0x1E	RS (record separator)	记录分隔符
0001 1111	037	31	0x1F	US (unit separator)	单元分隔符
0010 0000	040	32	0x20	(space)	空格
0010 0001	041	33	0x21	!	叹号
0010 0010	042	34	0x22	"	双引号
0010 0011	043	35	0x23	#	井号
0010 0100	044	36	0x24	$	美元符
0010 0101	045	37	0x25	%	百分号
0010 0110	046	38	0x26	&	和号
0010 0111	047	39	0x27	’	闭单引号
0010 1000	050	40	0x28	(	开括号
0010 1001	051	41	0x29	)	闭括号
0010 1010	052	42	0x2A	*	星号
0010 1011	053	43	0x2B	+	加号
0010 1100	054	44	0x2C	,	逗号
0010 1101	055	45	0x2D	-	减号/破折号
0010 1110	056	46	0x2E	.	句号
0010 1111	057	47	0x2F	/	斜杠
0011 0000	060	48	0x30	0	字符0
0011 0001	061	49	0x31	1	字符1
0011 0010	062	50	0x32	2	字符2
0011 0011	063	51	0x33	3	字符3
0011 0100	064	52	0x34	4	字符4
0011 0101	065	53	0x35	5	字符5
0011 0110	066	54	0x36	6	字符6
0011 0111	067	55	0x37	7	字符7
0011 1000	070	56	0x38	8	字符8
0011 1001	071	57	0x39	9	字符9
0011 1010	072	58	0x3A	:	冒号
0011 1011	073	59	0x3B	;	分号
0011 1100	074	60	0x3C	<	小于
0011 1101	075	61	0x3D	=	等号
0011 111	076	62	0x3E	>	大于
0011 1111	077	63	0x3F	?	问号
0100 0000	0100	64	0x40	@	电子邮件符号
0100 0001	0101	65	0x41	A	大写字母A
0100 0010	0102	66	0x42	B	大写字母B
0100 0011	0103	67	0x43	C	大写字母C
0100 0100	0104	68	0x44	D	大写字母D
0100 0101	0105	69	0x45	E	大写字母E
0100 0110	0106	70	0x46	F	大写字母F
0100 0111	0107	71	0x47	G	大写字母G
0100 1000	0110	72	0x48	H	大写字母H
0100 1001	0111	73	0x49	I	大写字母I
01001010	0112	74	0x4A	J	大写字母J
0100 1011	0113	75	0x4B	K	大写字母K
0100 1100	0114	76	0x4C	L	大写字母L
0100 1101	0115	77	0x4D	M	大写字母M
0100 1110	0116	78	0x4E	N	大写字母N
0100 1111	0117	79	0x4F	O	大写字母O
0101 0000	0120	80	0x50	P	大写字母P
0101 0001	0121	81	0x51	Q	大写字母Q
0101 0010	0122	82	0x52	R	大写字母R
0101 0011	0123	83	0x53	S	大写字母S
0101 0100	0124	84	0x54	T	大写字母T
0101 0101	0125	85	0x55	U	大写字母U
0101 0110	0126	86	0x56	V	大写字母V
0101 0111	0127	87	0x57	W	大写字母W
0101 1000	0130	88	0x58	X	大写字母X
0101 1001	0131	89	0x59	Y	大写字母Y
0101 1010	0132	90	0x5A	Z	大写字母Z
0101 1011	0133	91	0x5B	[	开方括号
0101 1100	0134	92	0x5C	\	反斜杠
0101 1101	0135	93	0x5D	]	闭方括号
0101 1110	0136	94	0x5E	^	脱字符
0101 1111	0137	95	0x5F	_	下划线
0110 0000	0140	96	0x60	`	开单引号
0110 0001	0141	97	0x61	a	小写字母a
0110 0010	0142	98	0x62	b	小写字母b
0110 0011	0143	99	0x63	c	小写字母c
0110 0100	0144	100	0x64	d	小写字母d
0110 0101	0145	101	0x65	e	小写字母e
0110 0110	0146	102	0x66	f	小写字母f
0110 0111	0147	103	0x67	g	小写字母g
0110 1000	0150	104	0x68	h	小写字母h
0110 1001	0151	105	0x69	i	小写字母i
0110 1010	0152	106	0x6A	j	小写字母j
0110 1011	0153	107	0x6B	k	小写字母k
0110 1100	0154	108	0x6C	l	小写字母l
0110 1101	0155	109	0x6D	m	小写字母m
0110 1110	0156	110	0x6E	n	小写字母n
0110 1111	0157	111	0x6F	o	小写字母o
0111 0000	0160	112	0x70	p	小写字母p
0111 0001	0161	113	0x71	q	小写字母q
0111 0010	0162	114	0x72	r	小写字母r
0111 0011	0163	115	0x73	s	小写字母s
0111 0100	0164	116	0x74	t	小写字母t
0111 0101	0165	117	0x75	u	小写字母u
0111 0110	0166	118	0x76	v	小写字母v
0111 0111	0167	119	0x77	w	小写字母w
0111 1000	0170	120	0x78	x	小写字母x
0111 1001	0171	121	0x79	y	小写字母y
0111 1010	0172	122	0x7A	z	小写字母z
0111 1011	0173	123	0x7B	{	开花括号
0111 1100	0174	124	0x7C	\|	垂线
0111 1101	0175	125	0x7D	}	闭花括号
0111 1110	0176	126	0x7E	~	波浪号
0111 1111	0177	127	0x7F	DEL (delete)	删除

常见ASCII码的大小规则：0 ~ 9 < A ~ Z < a ~ z。

数字比字母要小。如 “7”<“F”；
数字0比数字9要小，并按0到9顺序递增。如 “3”<“8” ；
字母A比字母Z要小，并按A到Z顺序递增。如“A”<“Z” ；
同个字母的大写字母比小写字母要小32。如“A”<“a” 。

几个常见字母的ASCII码大小： “A”为65；“a”为97；“0”为 48

GB2312简体中文编码表

code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A1A0 　、。 · ˉ ˇ ¨ 〃々 — ～ ‖ … ‘ ’
A1B0 “ ” 〔〕〈〉《》「」『』〖〗【】
A1C0 ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠
A1D0 ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵
A1E0 ∴ ♂ ♀ ° ′ ″ ℃ $ ¤ ￠￡ ‰ § № ☆ ★
A1F0 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A2A0 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ ? ? ? ? ?
A2B0 ? ⒈ ⒉ ⒊ ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖
A2C0 ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾
A2D0 ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③ ④ ⑤ ⑥ ⑦
A2E0 ⑧ ⑨ ⑩ ? ? 一二三四五六七八九十 ?
A2F0 ? Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ ? ?
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A3A0 ！ " # ￥ % & ’ （） * + ，－． /
A3C0 @ A B C D E F G H I J K L M N O
A3D0 P Q R S T U V W X Y Z [ \ ] ^ _
A3E0 ` a b c d e f g h i j k l m n o
A3F0 p q r s t u v w x y z { | }