一、
字符串在Python内部是unicode编码,所以从数据库调取数据,又或者request一个api返回的数据都是unicode编码形式。想要支持中文,建议将编码转为utf-8。下面介绍两个相关函数。
1、decode():将其他编码的字符串转换成unicode编码,如str1.decode(‘gb2312’),表示将gb2312编码的字符串str1转换成unicode编码。
2、encode():将unicode编码转换成其他编码的字符串,如str2. encode(‘utf-8’),表示将unicode编码的字符串str2转换成utf-8。
二、
要转换编码,则首先就需要了解字符串的编码形式:
isinstance(s, unicode)
如返回True则表示s是unicode编码
三、
解决办法举例:
将一个 有若干个unicode编码的字典元素的列表 转换为 有若干个utf-8编码的字典元素的列表
dic = []
for ep in unicodelist:
dic1 = {“endpoint”:ep[“endpoint”].encode(‘utf-8’), “id”:ep[“id”]}
dic.append(dic1)
python2.7处理unicode编码问题
最新推荐文章于 2024-04-30 19:24:04 发布