UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence

原创 2018年04月16日 09:38:57

针对我上一篇《简易版计算文本相似度》出现的问题:

Traceback (most recent call last):
  File "D:/pythonlianxi/wenbensimi1.py", line 52, in <module>
    d3 = open(doc3).read()

UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence

编码错误,好吧,在后面加上encoding='utf-8',问题依然存在。

Traceback (most recent call last):
  File "D:/pythonlianxi/wenbensimi1.py", line 9, in <module>
    d1 = open(doc1,'r',encoding='utf-8').read()
  File "C:\Users\asus\AppData\Local\Programs\Python\Python35\lib\codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb9 in position 0: invalid start byte

解决方法:因为打开的都是txt,所以就将文本另存为,编码从ANSI变成UTF-8,保存就可以了。



如果你已经这样做,还是有编码错误的话,建议把d3 = open(doc3,'r',encoding='utf-8').read(),改成d3=urilib.request.urlopen("http://127.0.0.1/zhenhuan.html").read().decode("utf-8"),把文本从txt改成html,并且可以在文本内容首尾加个标签<html></html>,保存,再将其放在服务器上,通过urilib.request.urlopen爬取到也可以。

Python全栈工程师-第2周

Python全栈工程师-第2周
  • 2017年09月15日 17:31

UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multib

在python3中读取文件时报错:UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xae in position 199: illegal mul...
  • qq_40229767
  • qq_40229767
  • 2018-03-02 16:34:16
  • 44

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence
  • Yaroo
  • Yaroo
  • 2017-10-30 14:02:58
  • 187

Python读取CSV文件:UnicodeDecodeError: 'gbk' codec can't decode byte 0xba ....illegal multibyte sequence

Python读取CSV文件报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xba in position 8: illegal multib...
  • stone9159
  • stone9159
  • 2018-01-11 21:25:04
  • 156

UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 11126: illegal multibyte sequence

使用python的时候经常会遇到文本的编码与解码问题,其中很常见的一种解码错误如题目所示,下面介绍该错误的解决方法,将‘gbk’换成‘utf-8’也适用。 (1)、首先在打开文本的时候,设置其编码格...
  • shijing_0214
  • shijing_0214
  • 2016-07-20 20:33:30
  • 34439

提示"UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequenc

python读取pkl文件时提示&quot;UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illega...
  • maqunfi
  • maqunfi
  • 2018-03-30 20:56:22
  • 24

UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 683: illegal multibyte sequence

读文件的时候出现编码错误,有两种方法。 第一种就是 f = open('test.txt','r',encoding = 'utf-8') content = f.readline() 打开文件...
  • djd1234567
  • djd1234567
  • 2016-04-15 10:50:48
  • 8378

UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 45: illegal multibyte sequence

 常见的一种解码错误如题目所示,下面介绍该错误的解决方法 (1)、首先在打开文本的时候,设置其编码格式,如:open(‘1.txt’,encoding=’gbk’); (2)、若(1)不能...
  • liaoqiu92
  • liaoqiu92
  • 2017-07-30 13:44:23
  • 1543

Python中读取txt文本出现“ 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence”的解决办法

今天,练习一个通过读取txt文本信息(英文版的Walden.txt),统计文本中的英文单词词频。在读取Walden.txt文本时,出现了“UnicodeDecodeError: 'gbk' codec...
  • lqzdreamer
  • lqzdreamer
  • 2017-08-01 18:01:40
  • 9337

UnicodeDecodeError: 'gb2312' codec can't decode byte 0x88 in position 164111: illegal multibyte sequ

使用python遇到UnicodeDecodeError: 'gb2312' codec can't decode byte 0x88 in position 164111: illegal mult...
  • echo_Ae
  • echo_Ae
  • 2017-10-10 14:35:44
  • 412
收藏助手
不良信息举报
您举报文章:UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence
举报原因:
原因补充:

(最多只允许输入30个字)