前言
上一节关于字节流的文章中,在使用字节流读取本地文件中的数据时,文件中只存放了英文,而并没有存放中文数据。我们还提到了不建议使用字节流读取纯文本文件的数据,否则会出现乱码的情况,那么,为什么会出现这样的情况呢?相信探讨完今天的内容,你会有新的理解。
在计算机中,任何数据都是以二进制的形式存储的,一位二进制数称为一个比特位,一个字节由 8 位二进制数组成,存放 2 的 8 次方个数据,字节是计算机中最小的存储单元
。
而英文存放数据只需要一个字节即可,为什么呢?这就需要我们学习字符集的知识,字符集也叫作编码表,例如 ASCII 字符集,把一些常用的字符编写为一个表,每个字符对应了一个整数值,ASCII 表中一共 128 个数据,其中英文就全部包括在其中,所以说,存放英文数据至于要一个字节即可。
目前的文字编码标准主要有 ASCII、GB2312、GBK、Unicode 等。ASCII 编码是最简单的西文编码方案。GB2312、GBK、GB18030 是汉字字符编码方案的国家标准。Unicode