字符串编解码转化
文件(utf-8编码)----(读取:转换为unicode)—>记事本(文字等内容在内存中为unicode编码)-----(保存,转换为utf-8)----->文件(utf-8)
服务器(生成内容由Unicode转换utf-8传输)------>输出utf-8网页内容------->浏览器
print(ord('A'))# 65
print(ord('我'))# 25105
print(chr(65))# A
print(chr(25105))# 我
# 字符需要传输和保存,需要我们对字符进行编解码,utf-8通用编解码
x = b'你好' # byte数组
print(x) # 报错bytes can only contain ASCII literal characters.中文超出了ascll码解码范围
# 在bytes中,无法显示ASC字符的字节,用\x##表示
print('你好'.encode('utf-8')) # b'\xe4\xbd\xa0\xe5\xa5\xbd'
print(b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('utf-8'))#你好
在含有中文的内容处理中,尽量使用UTF8。
关于优化:中文较多用gbk,英文较多用utf-8,可以优化传输