python 字符串unicode编码_python的string与Unicode转换，gbk字符串编码

最新推荐文章于 2021-01-05 06:04:32 发布

weixin_39599372

最新推荐文章于 2021-01-05 06:04:32 发布

阅读量1k

点赞数

文章标签： python 字符串unicode编码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39599372/article/details/111883817

版权

问题一

字串前面少了u。

当遇见以下情况。

返回字符串为'\u82f9\u679c'的unicode时候。

str1 = '\u82f9\u679c' # 这里没有u，当传入参数不是unicode的时候

print str1 # 结果是 : \u82f9\u679c

print u'\u82f9\u679c' # 结果是 : 苹果

解决方法：加上u

str1 = '\u82f9\u679c'

uni_result = str1.decode("unicode-escape")

print uni_result

# 结果是 : 苹果

问题二

字串前面多了u。

aa.text的结果如下

In[190]: aa.text

Out[190]: u'\xe4\xb8\x8a\xe6\xb5\xb7A\xe8\x82\xa1'

In[191]: print aa.text

Out[191]: ä¸�æµ·Aè�¡

In[192]: print '\xe4\xb8\x8a\xe6\xb5\xb7A\xe8\x82\xa1'

Out[192]: 上海A股

使用utf-8编码时候，出问题。打印结果不对

In[191]: aa.text.encode('utf-8')

Out[191]: '\xc3\xa4\xc2\xb8\xc2\x8a\xc3\xa6\xc2\xb5\xc2\xb7A\xc3\xa8\xc2\x82\xc2\xa1'

In[192]: print aa.text.encode('utf-8')

ä¸�æµ·Aè�¡

解决方案：去掉u

In[193]: aa.text.encode('raw_unicode_escape')

Out[193]: '\xe4\xb8\x8a\xe6\xb5\xb7A\xe8\x82\xa1'

In[194]: print aa.text.encode('raw_unicode_escape')

上海A股

或者使用

bb = eval(repr(aa.text).lstrip('u'))

print bb

上海A股

问题三

gbk的decode问题

gbk的编码有时候在是%C2%FA99%BC%F55这种格式，需要将之转化为python里面的\xc2\xfa99\xbc\xf55这种格式。

gbk的编码如下，(中文：满99减5)：

tmp_a = r'%C2%FA99%BC%F55'

tmp_a = '%C2%FA99%BC%F55'

而在python中，编码应该如下：

\xc2\xfa99\xbc\xf55

可以看出差异为，需要将%替换为\x。使用如下函数：

def transGbk2Unicode(str_v):

str_s = str_v.replace(r'%', r'\x')

res = eval(repr(str_s).replace('\\\\', '\\'))

return res.decode('gb2312')

tmp_a = r'%C2%FA99%BC%F55'

tmp_a = '%C2%FA99%BC%F55'

m = transGbk2Unicode(tmp_a)

print m

weixin_39599372

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 字符串unicode编码_python的string与Unicode转换，gbk字符串编码

问题一字串前面少了u。当遇见以下情况。返回字符串为'\u82f9\u679c'的unicode时候。str1 = '\u82f9\u679c' # 这里没有u，当传入参数不是unicode的时候print str1 # 结果是 : \u82f9\u679cprint u'\u82f9\u679c' # 结果是 : 苹果解决方法：加上ustr1 = '\u82f9\u...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。