文本文件和字符集
文本文件
• 文本分为两种 : 一种 纯文本 一种 富文本
• 纯文本只能保存单一的文本内容,无法保存内容无关的东西(例如 txt文本文档)
• 富文本可以保存文本以外的东西(例如 有道笔记)
• 纯文本在计算机底层也会转换为二进制保存
• 将字符转换为二进制码的过程,我们称之为编码 encode()
• 将二进制码转换成字符的过程,我们称之为解码 decode()
常见的字符集
• ASCII 美国人编码 使用7位来对美国常用的字符进行编码 包含128个字符
• ISO-8859-1 欧洲的编码 使用8位来编码 包含256个字符
• GBK 中国人编码(国标码)
• Unicode 万国码 包含世界上所有语言和字符 编写程序一般都会使用Unicode 编码
• Unicode 编码有多种实现 UTF-8 UTF-16 UTF-32