学习使用编码和解码

最新推荐文章于 2022-03-15 20:09:32 发布

weixin_34051201

最新推荐文章于 2022-03-15 20:09:32 发布

阅读量165

点赞数

文章标签： python 操作系统

原文链接：http://blog.51cto.com/rickyh/1952495

版权

目的：在处理字符时，如果编码和解码处理不当，就会出现乱码。

环境：ubuntu 16.04 python 3.5.2

情景：因为工作，需要写了一个自动接收邮件并针对特定内容导出到表格的脚本，但收到的邮件源信息一般都是字节信息，需要解码处理，即decode, 如果要发送邮件就需要使用编码encode。

函数：

str.decode('解码方式')

str.encode('编码方式')

这里decode接收字符串，并以指定的解码方式解码，如utf-8或gb2312，encode也是相同的操作。如果给的编码或解码方式错误，则会弹出UnicodeDecodeError:错误，可以用try---except来捕捉处理。

以下：

def decode_str(_str):
    try:
        _change_str = _str.decode('gb2312')
    except UnicodeDecodeError:
        _change_str = _str.decode('utf-8')

一般微软中文操作系统都是gb2312的。

再写一点枯燥的笔记：

字符编码，早期有美国人发明，定制了ASCII编码，只包含大小写字母、数字和一些符号，这样对其他语言的支持明显不够，中文一般需要两个字节，且不能与ASCII冲突，所以定制了GB2312用于中文，其他国家也有自己的编码，为了统一，Unicode应运而生，包含了所以不同的编码，但是在表示ACSII字符是多加了空的字节，浪费存储和传输，于是有了UTF-8，常见英文用一个字节，汉字通常用3个（Unicode用2个），兼容ASCII。现在传输和存储用UTF-8，内存和服务用Unicode。

参看资料：

第三方博客

转载于:https://blog.51cto.com/rickyh/1952495

weixin_34051201

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
学习使用编码和解码

目的：在处理字符时，如果编码和解码处理不当，就会出现乱码。环境：ubuntu 16.04 python 3.5.2情景：因为工作，需要写了一个自动接收邮件并针对特定内容导出到表格的脚本，但收到的邮件源信息一般都是字节信息，需要解码处理，即decode, 如果要发送邮件就需要使用编码encode。函数：str.decode('解码方式')str.encode('编码方式')...
复制链接

扫一扫