Python将字典中的Unicode编码显示成汉字

在log中为了看到舒适的打印日志,需要对unicode

在python 下面一个包含中文字符串的列表或字典,直接使用print会出现以下的结果:

>>> dict = {"asdf": "我们的python学习"}
>>> print dict
{'asdf': '\xe6\x88\x91\xe4\xbb\xac\xe7\x9a\x84python\xe5\xad\xa6\xe4\xb9\xa0'}
在输出处理好的数据结构的时候很不方便,需要使用以下方法进行输出:
>>> import json
>>> print json.dumps(dict, encoding="UTF-8", ensure_ascii=False)
{"asdf": "我们的python学习"}

----------ensure_ascii=False 比较关键

python json.dumps 中的ensure_ascii 参数引起的中文编码问题

在使用json.dumps时要注意一个问题

>>> import json
>>> print json.dumps('中国')
"\u4e2d\u56fd"

输出的会是
'中国' 中的ascii 字符码,而不是真正的中文。

这是因为json.dumps 序列化时对中文默认使用的ascii编码.想输出真正的中文需要指定ensure_ascii=False>>> import json
>>> print json.dumps('中国')
"\u4e2d\u56fd"
>>> print json.dumps('中国',ensure_ascii=False)
"中国"
>>> 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
FILE* fp = fopen(fileName, "r"); FILE* fpCompressed = fopen(compressedFileName, "wb"); char buffer = 0; int bitCount = 0; int c; while ((c = getc(fp)) != EOF) { 在 Python ,可以使用 `encode()` 方法将 Unicode 字符串转换为 UTF-8 编码的字节串。示 char* codeWord = code[c]; for (int i = 0; i < strlen(codeWord); ++i) { if例代码如下: ```python # 定义一个 Unicode 字符串 unicode_str = '中文字符串' # 将 Unicode 字 (codeWord[i] == '1') buffer |= (1 << (7 - bitCount)); ++bitCount; if (符串转换为 UTF-8 编码的字节串 utf8_bytes = unicode_str.encode('utf-8') # 打bitCount == 8) { fwrite(&buffer, sizeof(buffer), 1, fpCompressed); buffer = 0; 印转换后的结果 print(utf8_bytes) ``` 运行上述代码后,会输出转换后的 UTF- bitCount = 0; } } } if (bitCount != 0) fwrite(&buffer, sizeof(buffer),8 编码的字节串,例如: ``` b'\xe4\xb8\xad\xe6\x96\x87\xe5\x 1, fpCompressed); fclose(fp); fclose(fpCompressed); } int main() { char data[] = {'aad\x97\xe7\xac\xa6\xe4\xb8\xb2' ``` 需要注意的是,如果原始字符串已经', 'b', 'c', 'd', 'e', 'f'}; int freq[] = {5, 9, 12是 UTF-8 编码的字节串,可以使用 `decode()` 方法将其转换为 Unicode 字符串。示例, 13, 16, 45}; int size = sizeof(data) / sizeof(data[0]); struct MinHeapNode*代码如下: ```python # 定义一个 UTF-8 编码的字节串 utf8_bytes = b'\xe4 root = buildHuffmanTree(data, freq, size); char* code[MAX_TREE_HT]; char temp[MAX_TREE_HT]; encode\xb8\xad\xe6\x96\x87\xe5\xad\x97\xe7\xac\xa6\xe4\xb8\xb2' (root, code, temp, 0); compressFile("example.txt", "example.huff", code); printf("File compressed successfully# 将 UTF-8 编码的字节串转换为 Unicode 字符串 unicode_str = utf8_bytes.decode('utf-.\n"); return 0; } ``` 以上代码将文件 `example.txt` 压缩了二进制文件 `example.huff`。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值