文件的编码
打开一个文件,文件内容以某种编码形式文本进行展示。
ASCII
ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。
ASCII是由美国国家标准学会(American National Standard Institute,ANSI)制定的,使用标准的单字节字符编码方案,用于基于文本的数据。
共定义了128个字符,范围:0x00-0x7F,即一个字节(8位)首位为0,比如:0(0x30,48)、A(0x41,65)、a(0x61,97)
+------+------+------+------+------+------+------+------+------+
| | 0000 | 0001 | 0010 | 0011 | 0100 | 0101 | 0110 | 0111 |
+------+------+------+------+------+------+------+------+------+
| 0000 | | | | 0 | | | | |
| 0001 | | | | 1 | A | | a | |
| 0010 | | | | | | | | |
| 0011 | | | | | | | | |
| 0100 | | | | | | | | |
| 0101 | | | | | | | | |
| 0110 | | | | | | | | |
| 0111 | | | | | | | | |
| 1000 | | | | | | | | |
| 1001 | | | | | | | | |
| 1010 | | | | | | | | |
| 1011 | | | | | | | | |
| 1100 | | | | | | | | |
| 1101 | | | | | | | | |
| 1110 | | | | | | | | |
| 1111 | | | | | | | | |
+------+------+------+------+------+------+------+------+------+
ASCII码是大多数常用编码的基础
Unicode
Unicode,全称为Unicode标准(The Unicode Standard),其官方机构Unicode联盟所用的中文名称为统一码,又译作万国码、统一字元码、统一字符编码)。