1、字符问题
一个字符串是一个字符序列。
在2015年,字符最佳定义是Unicode字符。
因此Python3的str对象中获取的元素是Unicode字符,相当于Python2的unicode对象中获取的元素。
Unicode标准把字符的标识和具体的字节表述进行明确区分:
(1)字符的标识(码位):以4~6个十六进制数字表示,(字母A码位是U+0041)
(2)字节表述:取决于所用的编码。在UTF-8编码中,A(U+0084)码位编码成单个字符\x41
▲ 二进制序列类型bytes或bytesarray对象的各个元素都是介于0~255之间的整数。
bytes对象的切片还是bytes对象,bytesarray对象的切片还是bytesarray对象。
s[0] == s[:1] 只对str类型成立。