“写完这篇文章有一两个月了,中间忙着期末考试等各种事情就没去管它,刚运行了一下代码发现出现了编码错误,在爬取完第一页后,出现以下错误:
UnicodeEncodeError: 'gbk' codec can't encode character '\u22ef' in position 93: illegal multibyte sequence。
在查询了一些资料后,借鉴博客园中相关说明后,在代码开头加上如下声明:
import io
import sys
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默认编码
因为是我是在cmd下运行,所以需要改变标准输出的默认编码,具体说明请大家参照博客园中相关说明”
更新时间:2017/1/12
====================================================================================================================================
<