摘要:汉字作为 str 单独 print 时可以正常输出,作为其他模块元素 print 时可能会被转译,无法输出汉字。
这几天写了一个python 爬虫,在进行正则匹配的过程中始终无法输出汉字。
爬取的网页如下:
正则匹配的语句如下:
print ans 后:
后来在https://www.zhihu.com/question/28528717查到这个问题,其原因是:
字符串单独作为 print 的参数时,是可以显示成中文的。
而包含在其他对象内部时,它的 str() 结果可能是被转义过的
在本文的代码中,因为是把汉字放在 list 中输出的,所以 str 的结果被转译,无法输出汉字。将 list 内容转为 str,修改代码为:
可以正常输出: