python字符编码
1、ASCII
美国信息交换标准代码,一个字节最多表示256个字符。
2、Unicode
Unicode 被称为万国码、国际码、统一码、单一码,Unicode编码通常为两个字节。
3、UTF-8
UTF-8 通用转化格式,UTF-8 最大的特点就是长度可变,英文字符一个字节、汉字三个字节。
4、python字符编码
实例1:str字符串和bytes字符串转化
strOne="杨黎"
# str字符串转化为bytes字符串
print(strOne.encode("utf-8"))
# bytes字符串转化为str字符串
print(strOne.encode("utf-8").decode("utf-8"))
实例1返回结果:
b'\xe6\x9d\xa8\xe9\xbb\x8e'
杨黎
实例2:不可见字符
# 不可见字符
strOne="\u200b"
print(strOne.encode("utf-8"))
# 如果utf-8改成gbk还会报错
# UnicodeDecodeError: 'gbk' codec can't decode byte 0x8b in position 2: incomplete multibyte sequence
print(strOne.encode("utf-8").decode("utf-8")+"不可见字符")
实例2返回结果:
b'\xe2\x80\x8b'
不可见字符