当我们使用python向文件写入中文时,有时中文还是会乱码,
使用with open写入中文文本的代码如下:
open('grs_new2.json','w+',encoding = 'utf-8') as file2:
file2.write(json.dumps(line)+"\n")
写入后的文本是这种:
像文中这种“\u51fa\u751f\u5730”其实是汉字对应的ASCII编码,比如上述的“\u51fa\u751f\u5730”对应的汉字就是“出生地”,这个很容易通过在线的Unicode与中文转换得到。但是我们需要显示的是汉字而不是Unicode码,这个其实是我们将字符串或字典转化为json格式写入文件时还少处理了一步,就是在json.dumps()中line后面添加“ensure_ascii=False”,也即改成如下形式:
open('grs_new2.json','w+',encoding = 'utf-8') as file2:
file2.write(json.dumps(line,ensure_ascii=False)+"\n")
这样就可以将汉字写入文件中而不会出现乱码了。