python 爬虫过程中汉字编码的问题

摘要:汉字作为 str 单独 print 时可以正常输出,作为其他模块元素 print 时可能会被转译,无法输出汉字。

这几天写了一个python 爬虫,在进行正则匹配的过程中始终无法输出汉字。
爬取的网页如下:

正则匹配的语句如下:

print ans 后:

后来在https://www.zhihu.com/question/28528717查到这个问题,其原因是:
字符串单独作为 print 的参数时,是可以显示成中文的。
而包含在其他对象内部时,它的 str() 结果可能是被转义过的
在本文的代码中,因为是把汉字放在 list 中输出的,所以 str 的结果被转译,无法输出汉字。将 list 内容转为 str,修改代码为:

可以正常输出:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值