python爬虫或web中出现"\\u4e00"unicode字符串的原因

我们的python在爬虫或web中,默认是不需要我们获取进行编码和解码的
因为框架自动帮我们编码然后返回给我们,但是一般用的都是UTF-8,如果这个数据的编码方式是unicode-escape怎么办呢,那么我们就会获得一堆类似于"\u4e00"这样的字符串

解决办法:
unicode_str = '\\u4e00'
str_a = unicode_str.encode().decode("unicode-escape")
# 此时stra就是我们的中文字符了
# 先用UTF-8编码方式将其转换回字节码,然后再用正确的对应的编码转回来

如果我们获得的是’\u4e00’这样的字符串,那么不用转换,存储的时候以utf-8存储即可

with open('test.txt','w',encoding='utf-8') as f:
    f.write("\u4e00")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值