解读编码和文件读写
编码的本质就是让只认识0和1的计算机,能够理解我们人类使用的语言符号,并且将数据转换为二进制进行存储和传输。
这种从人类语言到计算机语言转换的形式,就叫做编码表,它让人类语言和计算机语言能够一一对应起来。
Unicode与UTF-8的关系:Unicode是内存编码的规范,而UTF-8是如何保存和传输Unicode的手段。
所谓编码
现在使用情况
- 1
计算机是有自己的工作区的,这个工作区被称为“内存”。数据在内存当中处理时,使用的格式是Unicode,统一标准。在Python3当中,程序处理我们输入的字符串,是默认使用Unicode编码的,所以什么语言都可以输入。 - 2
数据在硬盘上存储,或者是在网络上传输时,用的是UTF-8,因为节省空间。但你不必操心如何转换UTF-8和Unicode,当我们点击保存的时候,程序已经“默默地”帮我们做好了编码工作。 - 3
一些中文的文件和中文网站,还在使用GBK,和GB2312。