文件:存储在外部介质上的数据或信息
文件:有序的数据序列
文本显示:
计算机显示功能的基本问题。
编码:信息从一种形式转化为另一种形式
常用的编码:
ASCII码
- 7个二进制编码
- 表示128个字符
- python中提供了 ord(‘A’) = 65 chr(65) = ‘A’
Unicode编码
- 跨语言、跨平台
- 统一且唯一的二进制编码
- 每个字符两个字节长
- 65536个字符的编码空间
- 中文中的“严”字其Unicode的十六进制为4E25
UTF-8编码
- 可变长度的Unicode
- “严” 十六进制数为E4B5A5
- 中文字符是使用UTF-8三字节来表示
Unicode与UTF-8
(python中字符串类型未编码 可以使用encode进行编码,使用decode进行解码)
例如:
GBK编码
- 全称《汉字内码扩展规范》
- 双字节编码