'utf-8' codec can't decode bytes in position 199: invalid continuation byt... 我的问题解决方案

最新推荐文章于 2024-06-21 10:51:21 发布

zhangyu_ILD

最新推荐文章于 2024-06-21 10:51:21 发布

阅读量4.2k

点赞数 2

文章标签： python

本文链接：https://blog.csdn.net/zhangyu_ILD/article/details/90638028

版权

简单说，这是个编码与解码的问题。我前几天刚遇到这种情况，作为小白的我，开始也是不知道该怎么处理，查了一些解决方法，但并不适合我自己出现的情况，虽说最终也解决了，但也浪费了我近半个小时。所以，在这里我也跟遇到这种情况的小白们分享一下我的方法，希望能对大家有所帮助，若有不对的地方请指出，我必将即使改正，为后来遇到同样问题的朋友们提供方便。高手请一笑置之。

方法一（这也是我用到的方法）：

先说明使用要求：此方法用与不需完全准确读取文件，自己只需要文件中的一部分内容，编码译码的方式对自己所需要的那部分内容影响不大或无影响。

例如：

文件内容太过庞大（例如我这个文件有8000多行），而自己只需要“Energy of First State:"后面的数据，那么就可以使用这种方法：

file_object = open("...",'rb')                         #以二进制形式打开文件
E_F = []
for lines in file_object.readlines():                  #读取每一行
    line = lines.decode('utf-8','ignore')              

"""将以二进制形式的每一行再解码成utf-8，后面要填'ignore',不能用'strict'
   后面就是对每一行做处理了"""

方法二：

找出出现问题的地方，人工修改：

用下列程序按照自己的实际情况编写：

f = open("...","rb")
i = 0
while True:
    i += 1 
    print(i)
    line = f.readline()
    if not line:
        break
    else:
        try:
            line.decode('utf-8')
        except:
            print(str(line))

根据输出的结果判断在文件哪里出了问题，人工修改后即可。