大家在进行爬虫或者各种数据读取处理的时候,总会出现各种的编码问题
我也是烦死了,特意做一个总结吧
1、查看python默认编码
import sys
print(sys.platform)
print(sys.getdefaultencoding())
2、如果python代码中需要将unicode形式的字符串转换为中文
text = b'\u8bf7' # 中文是 ‘请’的意思
处理:
text.decode('unicode_escape')
如果text = r'\u8bf7' # 也就是字符串的形式
也可以写为:text = '\\u8bf7'
处理:
text.encode('latin-1').decode('unicode_escape')
’