python中二进制转换成字符串
一、参照链接:https://www.cnblogs.com/cansun/p/8025547.html
python本身默认编码为unicode
#所有编码转换时都需通过unicode
msg = “北京”
print(msg.encode(encoding = “utf-8”))#unicode编码转换为utf-8编码
print(msg.encode(encoding = “utf-8”).decode(encoding = “utf-8”))#unicode编码转换为utf-8编码,再转化为unicode编码
结果:
b’\xe5\x8c\x97\xe4\xba\xac’
北京
二、python中以二进制读取文件时,怎么最后转成字符串?
f = open(‘文件.txt’,‘rb’)
line = f.readline()
s = line.decode(encoding = ‘utf-8’)
print(s)
f.close()
以rb形式读取文件时,使用utf-8来编码的。所以最后要用这个编码来解码。
三、python中open()函数怎么读取中文的文件
文件.txt 中存储的是一段中文。
然后如下编码时会出错:
f = open(‘文件.txt’,‘r’)
line = f.readline()
错误是UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa7 in position 22: illegal multibyte sequence
如果如下编码时,就会正确:
f = open(‘文件.txt’,‘r’,encoding = ‘utf-8’)
line = f.readline()
print(line)
f.close()