python编码各种问题

最新推荐文章于 2021-11-29 15:40:07 发布

飞飞小鱼L

最新推荐文章于 2021-11-29 15:40:07 发布

阅读量1.1k

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leoduo2013/article/details/39395039

版权

python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

这两天处理数据，从数据库获取数据，用python的MySQLdb。但是中文总是出现乱码。

在此做个小结

1.mysql编码（网上资料太多自行搜索之）

2.python默认编码

开始只是改了mysql端的编码，改为UTF8，发现问题依旧。比如：

UnicodeDecodeError: 'ascii' codec can't decode byte 0xa1 in position xxx...

这是由于python默认编码是ASCII，故需要设置为UTF-8。使用sys中的setdefaultencoding方法：

import sys
sys.setdefaultencoding('utf8')

然而会报错：

AttributeError: 'module' object has no attribute 'setdefaultencoding'

百度google之后，发现sys.setdefaultencoding 方法在python导入 site.py 后就删除了，不能再被调用了。

site.py源码：https://hg.python.org/cpython/file/2.7/Lib/site.py#l545

注意看main函数最后几行

    if hasattr(sys, "setdefaultencoding"):
        del sys.setdefaultencoding

site.py 是 python 解释器启动后，默认加载的一个脚本。如果使用 python -S 启动的话，将不会自动加载 site.py。

只能重新reload(sys)一下。于是：

import sys
reload(sys)
sys.setdefaultencoding('utf8')

如何简化，不用每次添加这几行。

增加一个名为 sitecustomize.py，推荐存放的路径为 site-packages 目录下。sitecustomize.py 是在 site.py 被import 执行的，因为 sys.setdefaultencoding() 是在 site.py 的结尾处被删除的，所以，可以在 sitecustomize.py 使用 sys.setdefaultencoding()。

#file name:  sitecustomize.py
import sys  
sys.setdefaultencoding('utf-8')

既然 sitecustomize.py 能在python启动时被自动加载，所以除了设置编码外，也可以设置一些其他的东西。

3.源代码编码

习惯性以这个开头即可

# -*- coding:utf-8 -*-

4.unicode中混杂u'\xa0'

该问题是由于源数据中混杂不同编码的空格，如果直接输出到文件不会出问题，但是命令行输出，或者进行转码操作会报如下错误：

UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0' in position xxx:illegal multibyte sequence

如果将其中的unicode串u'\xa0'替换正常了。

us.replace(u'\xa0', u' ')

其中us是一个unicode串

其实unicode自带方法.strip()可以直接去掉'\xa0'这样的空格

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python编码各种问题

这两天处理数据，从数据库获取数据，用python的MySQLd
复制链接

扫一扫

专栏目录

博客等级

码龄13年

25
原创

6
点赞

6
收藏

2
粉丝

关注

私信

热门文章

分类专栏

Machine Learning 6篇
Data Mining 5篇
linux 15篇
python 3篇
hadoop 1篇
openstack 6篇
scrapy
git 1篇
SourceTree
ssh key
ovs 1篇
xen 2篇
chroot 1篇
jail 1篇
nginx 1篇
tomcat 1篇

最新评论

取消Wmvare自动安装centOS
ITesay: 可以啊哈哈
SourceTree添加SSH key访问git
Tisfy: 写得太好了！正如那：男儿何不带吴钩，收取关山五十州。
配置xen上VM混杂模式，使其能捕获物理网络流量
sophy2008: 2.在xenserver中加入一个开机执行脚本，将上一步中文件暂存id置-1。这个目的是为了防止xenserver断电、重启等情况，目标VM分到与之前一样id的domain域，导致没有更新镜像。 --------修改dom_id的文件存在哪啊？
horizon_note(openstack dashboard)
记录学习的点滴: 您好！我在安装过程中也出现这个问题。报错是：ImportError: Could not import settings 'openstack_dashboard.settings' (Is it on sys.path?): No module named heatclient。然后我在/opt/stack/horizon/openstack_dashboard/local 目录下用您给的solution，但是并没有解决。请问这个问题是什么原因呢？是dashboard没有启起来吗？能否自己手动安装Dashboard? cp openstack_dashboard/local/local_settings.py.example openstack_dashboard/local/local_settings.py

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。