python中编码转换unicode

最新推荐文章于 2024-07-10 15:36:58 发布

一只勤奋爱思考的猪

最新推荐文章于 2024-07-10 15:36:58 发布

阅读量483

点赞数

分类专栏： python spark海量数据分析

本文链接：https://blog.csdn.net/sinat_26566137/article/details/81103255

版权

spark海量数据分析同时被 2 个专栏收录

187 篇文章 3 订阅

订阅专栏

python

148 篇文章 0 订阅

订阅专栏

实现代码如下：
a = 'abce'
# print type(a)
b = a.decode("ascii")
# print type(b)
c = a.decode("ascii").encode("utf-8")
# print type(c)


在python中进行编码转换都是通过unicode作为中间值实现的。所以要先decode成unicode字符，然后再使用encode转换成utf-8编码的str。可以把注释取消了，看下转换过程中的类型。

python ascii转unicode 转换不成功
print(chardet.detect(str(row['big_hy_name'])))
        print(chardet.detect(str(row['big_hy_name']).decode("utf-8",'ignore')))

优化前
for k,v in dict1.items():
    for index, row in df1.iterrows():
        if k == row['big_hy_name']:

优化后：
for idx,row in df1.iterrows():
    if row["big_hy_name"] in map_dict.keys():