UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 35: illegal multibyte sequ

我们在Windows 上使用python 时,控制台打印数据,比如打开文件或者从URL地址获取数据分析,会出现:

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 35: illegal multibyte sequ

这是因为控制台是gbk编码的,unicode字符串中包含一些gbk中无法显示的字符。我们只要替换掉不能正常显示的字符,

xa0 表示空格,我们可以替换成空字符或者换行,可以自行设置加上 

.replace('\xa0','\n\n') 替换为换行   或者 .replace('\xa0','') 替换为空

或者多个空格替换为一个换行 .replace('\xa0'*8,'\n\n')

代码:

print(texts[0].text)

结果:

修改后的代码:

print(texts[0].text.replace('\xa0'*8,'\n\n'))

执行结果正常,没有再报错。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值