最近项目接口申请提测时,由docker部署代码后,发现代码正常跑起来了,但是调用接口时报错500,通过docker logs 查看docker的日志发现程序报错,报错代码为:UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 77-87: ordinal not in range(128)。通过报错字面意思理解我们可以发现此次报错是因为编码解码原因造成(ps:好吧,恶心的编码解码,真的是坑!),我们知道对于python3.x版本,特别是python3.6版本(因为我的基础环境引用的便是python3.6)默认编码就是utf-8,不存在ascii来解码的呀,这就有点意思了。
在解决问题前先普及一下locale是什么:
在 Linux 中通过 locale 来设置程序运行的不同语言环境,locale 由 ANSI C 提供支持。locale 的命名规则为:
<语言>_<地区>.<字符集编码>
如:
zh_CN.UTF-8,zh代表中文,CN代表大陆地区,UTF-8表示字符集。
在locale环境中,有一组变量,代表国际化环境中的不同设置:
1、LC_COLLATE
定义该环境的排序和比较规则
2、LC_CTYPE
用于字符分类和字符串处理,控制所有字符的处理方式,包括字符编码,字符是单字节还是多字节,如何打印等。是最重要的一个环境变量。
3、LC_MONETARY
货币格式
4、LC_NUMERIC
非货币的数字显示格式
5、LC_TIME
时间和日期格式
6、LC_MESSAGES
提示信息的语言。另外还有一个LANGUAGE参数,它与LC_MESSAGES相似,但如果该参数一旦设置,则LC_MESSAGES参数就会失效。LANGUAGE参数可同时设置多种语言信息,如
LANGUANE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"。
7、LANG
LC_*的默认值,是最低级别的设置,如果LC_*没有设置,则使用该值。类似于 LC_ALL。
8、LC_ALL
它是一个宏,如果该值设置了,则该值会覆盖所有LC_*的设置值。注意,LANG的值不受该宏影响。
一个例子:
设置前,使用默认locale:
locale
LANG="POSIX"
LC_CTYPE="POSIX"
LC_NUMERIC="POSIX"
LC_TIME="POSIX"
LC_COLLATE="POSIX"
LC_MONETARY="POSIX"
LC_MESSAGES="POSIX"
LC_PAPER="POSIX"
LC_NAME="POSIX"
LC_ADDRESS="POSIX"
LC_TELEPHONE="POSIX"
LC_MEASUREMENT="POSIX"
LC_IDENTIFICATION="POSIX"
LC_ALL=
设置后,使用zh_CN.GBK中文locale:
# export LC_ALL=zh_CN.GBK
# locale
LANG=zh_CN.UTF-8
LC_CTYPE="zh_CN.GBK"
LC_NUMERIC="zh_CN.GBK"
LC_TIME="zh_CN.GBK"
LC_COLLATE="zh_CN.GBK"
LC_MONETARY="zh_CN.GBK"
LC_MESSAGES="zh_CN.GBK"
LC_PAPER="zh_CN.GBK"
LC_NAME="zh_CN.GBK"
LC_ADDRESS="zh_CN.GBK"
LC_TELEPHONE="zh_CN.GBK"
LC_MEASUREMENT="zh_CN.GBK"
LC_IDENTIFICATION="zh_CN.GBK"
LC_ALL=zh_CN.GBK
"C"是系统默认的locale,"POSIX"是"C"的别名。所以当我们新安装完一个系统时,默认的locale就是C或POSIX。
接下来继续说这个坑:
在linux执行“locale charmap”命令后发现,系统提示如下:
再执行“locale”,系统提示如下:
这不是说明这个基础环境的系统编码就是默认的locale么!那么问题来了,为什么“ANSI_X3.4-1968”编码就要报错呢?
查阅相关资料后,发现这个“ANSI_X3.4-1968”,遇到中文就会报错,而我的接口里的日志会打印到控制台,而无论是print还是console,都会经过“ANSI_X3.4-1968”解码后打印出来,所以就报错了。
知晓了原因后,就要解决问题了:
既然是要打印中文,所以首先linux的locale环境要安装zh_CN.UTF-8,俗称中文语言包。步骤如下:
(1)安装中文字库:“apt-get install language-pack-zh-hans”,安装成功后执行“locale -a”可以看到:
已经安装好了zh_CN.UTF-8(ps:zh_SG.utf8位繁体字中文包)
(2)执行以下:
export LC_ALL=zh_CN.utf8
export LANG=zh_CN.utf8
export LANGUAGE=zh_CN.utf8
执行“locale”发现系统语言环境已经改变:
更改成功!(ps:如果需要将linux提示换成中文可再执行“apt-get -y upgrade”)
执行“locale charmap”:
已更改为UTF-8解码了
完成步骤后将此镜像作为基础镜像就可以正常使用了,总结这次坑,再次提醒各位,构建基础环境时一定不要忘了检查“时区”和“系统语言环境”哦!