想通过zabbix的告警脚本实现发送邮件的功能。但告警消息中含有中文字符。在python脚本中发邮件时,报错。
场景:
- 设置脚本1.py后,使用报警媒介的测试功能进行检查。
- 传输参数如下,消息内容包含有中文。
分析
- 根据报警信息:
UnicodeEncodeError: 'utf-8' codec can't encode characters in position 0-5: surrogates not allowed
分析,报错是字符的编码格式错误。
代码如下:
#!/usr/bin/python3.6
# -*- coding: utf-8 -*-
import requests
import json
import sys
import smtplib
import time
from email.mime.text import MIMEText
print(sys.argv)
arg = sys.argv[3]
print("arg is:", arg)
message = MIMEText(arg, 'plain', 'utf-8' )
print("success")
print(message)
exit(1)
- 首先打印传输过来的参数,获得结果:
['/usr/lib/zabbix/alertscripts/1.py', '111', 'Test subject', '\udce4\udcb8\udcad\udce6\udc96\udc87']
-
“中文”两个汉字被转换成了"\udce4\udcb8\udcad\udce6\udc96\udc87"。首先,确定这个是unicode,经分析这个格式是utf-8编码后的。即zabbix在调用接口的时候,进行了数据的转换,并没有把“中文”两个字直接输出,而是经过了转换。
将“中文”两个字进行utf-8编码后,对比"\udce4\udcb8\udcad\udce6\udc96\udc87",可以看到\x对应\udc,转后,完全一致。网上说这是字符串\x(16进制)与\u(unicode)编码的两种情况。 -
添加修改编码的语句后,正常:
#!/usr/bin/python3.6
# -*- coding: utf-8 -*-
import requests
import json
import sys
import smtplib
import time
from email.mime.text import MIMEText
print(sys.argv)
arg = sys.argv[3]
print("arg is:", arg)
arg2 = arg.encode('utf-8', errors='surrogateescape').decode('unicode_escape')
message = MIMEText(arg2 , 'plain', 'utf-8' )
print("success")
print(message)
exit(1)
总结:
- sys.argv传入的参数默认格式是utf-8
- 一般来说python3内部声明的都是Unicode(\x),python3可以自动进行\x和\u的转换,所以print()等函数可以正常输出
- zabbix传入的参数是\u字符串,但python3在处理内部声明时,为了精简空间,将数据转换成了\x(十六进制),所以需要从\u向\x进行转换,但不能直接使用encode(‘utf-8’),会报错
arg2 = arg.encode('utf-8')
UnicodeEncodeError: 'utf-8' codec can't encode characters in position 0-5: surrogates not allowed
需要添加参数errors='surrogateescape’来屏蔽错误。Python 3 中新增的 surrogateescape 则是一种可逆的错误处理机制,利用 Surrogate 码位保存无法解码的字节,编码时则将其还原为对应的原始字节。
- python3使用decode(‘unicode_escape’),而python2使用decode(‘utf-8’)。