基础(十二)
字符串概述
类型
str字符串
bytes字节
bytearray字节数组
编码架构
字符集:赋值一个编码到某个字符,以便在内存中表示
编码:encoding:转换字符到原始字节形式
解码:decoding:依据编码名称转换原始字节到字符的过程
字符串存储
编码只作用于文件存储或中间媒介转换的时候
内存里面存储解码后的文本
常用字符编码
import sys
sys.getdefaultencoding()
'utf-8'
ASCII
存储在一个Byte 0-127
latin-1
存储在一个Byte 128-255
UTF-8(通用性更好)
可变字节
- 0-127 使用单字节
- 128-2047 双字节存储
- 大于2047 3-4Byte
UTF-16
2 Byte 存储字符 另外两个作为标识
UTF-32
4 Byte
注意:文件操作gbk
>>>open('data.txt','w').write('雪同学')
3
>>>open('data.txt','r',encoding = 'gbk').read()
雪同学
内置函数
ord()
获取字符代码点
chr()
获取代码点对应字符
>>>