UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 216: illegal multibyte sequence
decode:解码,codec:编解码器,multibyte:多字节,illegal:非法。
这是我在用Open()函数打开一个网页文档时出现的错误。此错误大概的意思就是,用gbk编码方式无法识别网页内容。
解决的办法也很简单:直接在给open函数添加参数即可:
file = open('bjh.html',encoding='UTF-8',errors='ignore')
encodeing参数是将gbk编码改为utf-8编码,errors的意思是如果open过程当中出现了编码错误,直接忽略,不影响程序运行。