有一个表中的字段 是gbk格式,比如该字段是comment:这是人和公园的西门
然后 将该字段 要插入另一个表(utf8)中的某个字段:该字段是个json,
往该json中添 加一个新的字段comment。
操作步骤:读取json,添加comment字段,json.dumps(data),写入表中。
发现表中是unicode编码, 且所有中文都变成字符串形式
u8fd9u662fu4ebau548cu516cu56edu7684u897fu95e8,
解决方法,在json中存在中文字符时,重新json.dump时候一定要加入ensure_ascii=False选项
,才可以,不会进行ascii的编码,要不然,写入表中的为unicode的字符串,
(想要恢复的话,需要读取出来,将u换成\u ,
然后json.dump加上ensure_ascii=False,写入表中即可)
几种方法测试排查
1 将gbk 解码 成 unicode 装进json 在dumps
utf-8 数据库表 显示:u8fd9u662fu4ebau548cu516cu56edu7684u897fu95e8
2 将gbk 解码 成 unicode 装进json 再dumps 再.decode('unicode_escape')
utf-8 数据库表 显示:这是人和公园的西门
3 将gbk 解码 成 unicode 再编码成utf-8 装进json 在dumps
utf-8 数据库表 显示:u8fd9u662fu4ebau548cu516cu56edu7684u897fu95e8
4 将gbk 解码 成 unicode 再编码成utf-8 装进json 在dumps 再.decode('unicode