https://blog.csdn.net/daijiguo/article/details/78354320?utm_source=blogxgwz9
unicode string:
以unicode作为编码表(信源编码),仅仅代表一个字符,未存储,因此未被编码。从函数中返回的字符都是unicode string,因为未存储,所以未被编码。
byte string(即python中的str类型):
以unicode作为编码表(信源编码),以utf8作为信道编码,一个中文字符对应三个字节。从文件读取的字符,因为已经存在磁盘中,因此都是byte string。python文件中初始化的字符串,也是byte string,因为.py文件本身就是存在硬盘中的