python编解码的那些事儿

最新推荐文章于 2024-04-28 15:13:04 发布

进哥说Java面试

最新推荐文章于 2024-04-28 15:13:04 发布

阅读量822

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/xhjcehust/article/details/51232551

版权

python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

在python编程尤其是处理web应用时，遇到编解码问题的概率较大，通常这种问题也比较繁琐，记下自己的理解，以备不时之需。

编解码内涵

编解码存在的意义主要是由于各种不同编码方式的存在，有gbk啦，也有utf-8啦，还有gb2312等等。python中的decode和encode的参数意义是一样的，即decode("utf-8")代表根据utf-8的编码规则来解码文本，最终得到的就是未经编码的数据了，encode("utf-8")代表根据utf-8的编码规则来编码文本，最终得到的就是编码后的数据了。

python处理编解码方式

在python如果知道文本的编码方式可以直接通过str1 = str1.decode("utf-8")这样的方式来解码文本，但很多情况下我们是不知道文本的编码方式的，那么有没有比较好的通用方式帮我们识别呢？答案是有，就是使用chardet库。

chardet库的使用

chardet使用方式如示例代码，其提供了获取编码方式的接口，直接调用就可以了

import chardet
mychar = chardet.detect(text)
print mychar["encoding"]
text = text.decode(mychar['encoding'],'ignore')

text现在成了未编码数据，要想编码成其他类型的直接调用encode接口就可以了。

进哥说Java面试

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python编解码的那些事儿

在python编程尤其是处理web应用时，遇到编解码问题的概率较大，通常这种问题也比较繁琐，记下自己的理解，以备不时之需。编解码内涵编解码存在的意义主要是由于各种不同编码方式的存在，有gbk啦，也有utf-8啦，还有gb2312等等。python中的decode和encode的参数意义是一样的，即decode("utf-8")代表根据utf-8的编码规则来解码文本，最终得到的就是未经编码的
复制链接

扫一扫

专栏目录