版本:Python2.7.3
其他库:Python请求1.2.3、jinja2(2.6)
我有一个向论坛提交数据的脚本,问题是非ascii字符显示为垃圾。例如,像AndréTéchineé这样的名字就是AndrÃTÃchinÃ)。
以下是提交数据的方式:
1)数据最初从UTF-8编码的CSV文件加载,如下所示:entries = []
with codecs.open(filename, 'r', 'utf-8') as f:
for row in unicode_csv_reader(f.readlines()[1:]):
entries.append(dict(zip(csv_header, row)))
当我在解释器中键入条目名时,我将其视为u'Andr\xe9 T\xe9chin\xe9'。
2)接下来我通过jinja2呈现数据:tpl = tpl_env.get_template(u'forumpost.html')
rendered = tpl.render(entries=entries)
当我键入在解释器中呈现的名称时,我再次看到相同的名称:u'Andr\xe9 T\xe9chin\xe9'
现在,如果我将呈现的变量写入这样的文件名,它将正确显示:with codecs.open('out.txt', 'a', 'utf-8') as f:
f.write(rendered)
但我必须把它送到论坛:
3)在邮政请求代码中,我有:params = {u'post': rendered}
headers = {u'content-type': u'application/x-www-form-urlencoded'}
session.post(posturl, data=params, headers=headers, cookies=session.cookies)
会话是请求会话。
而且这个名字在论坛帖子中显示的很烂。我试过以下方法:漏掉标题
Encode呈现为rendered.Encode('utf-8')(相同结果)
rendered=urllib.quote_plus(rendered)(显示为所有%XY)
如果我输入rendered.encode('utf-8'),我会看到以下内容:'Andr\xc3\xa9 T\xc3\xa9chin\xc3\xa9'
我怎样才能解决这个问题?谢谢。