关于python编码的基本常识
- 在python里面 “明文”是
unicode
类型 “密文”是其他的编码格式 如gbk
utf-8
latin-1
等等 - 编码: “明文”->”密文”
.encode([目标编码格式])
对象必须为unicode
类型 - 解码: “密文”->”明文”
.decode([源编码格式])
对象为str
类型 - 对于汉字 一共有三大类编码方式
- 以中文汉字”李”为例子
- a. unicode类 机器码
\x67\x4e
- unicode(python表示)
\u674e
- HTML Entity
李
- UTF-16(BE)
0x674E
- UTF-32(BE)
0x0000674E
- unicode(python表示)
- b. UTF-8类 机器码
\xe6\x9d\x8e
- UTF-8(python表示)
\xe6\x9d\x8e
- URL Escape Code
%E6%9D%8E
- Octal Escape Sequence
\346\235\216
- UTF-8(python表示)
- c. gb类 机器码
\xc0\xee
gb2312
gbk
gb18030
\xc0\xee
- 在python里面 “明文”是
Python for Windows 中文编码问题汇总
最新推荐文章于 2024-06-18 20:47:59 发布