关于python编码的基本常识
- 在python里面 “明文”是
unicode
类型 “密文”是其他的编码格式 如gbk
utf-8
latin-1
等等 - 编码: “明文”->”密文”
.encode([目标编码格式])
对象必须为unicode
类型 - 解码: “密文”->”明文”
.decode([源编码格式])
对象为str
类型 - 对于汉字 一共有三大类编码方式
- 以中文汉字”李”为例子
- a. unicode类 机器码
\x67\x4e
- unicode(python表示)
\u674e
- HTML Entity
李
- UTF-16(BE)
0x674E
- UTF-32(BE)
0x0000674E
- unicode(python表示)
- b. UTF-8类 机器码
\xe6\x9d\x8e
- UTF-8(python表示)
\xe6\x9d\x8e
- URL Escape Code
%E6%9D%8E
- Octal Escape Sequence
\346\235\216
- UTF-8(python表示)
- c. gb类 机器码
\xc0\xee
gb2312
gbk
gb18030
\xc0\xee
- 在python里面 “明文”是
Python for Windows 中文编码问题汇总
最新推荐文章于 2024-09-04 19:55:26 发布
本文详细介绍了Python在Windows环境下处理中文编码的各种问题,包括Unicode、UTF-8和GBK编码的转换,以及Python文件编码设置、字符串类型、print输出中文、文件读写和爬虫结果存储的注意事项。建议在字符串处理中采用Unicode,并在数据输入输出时进行适当的decode和encode操作。
摘要由CSDN通过智能技术生成