UicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x9d in position 1936: illegal multibyte sequence

天乔巴夏丶

于 2024-06-28 16:01:13 发布

阅读量494

点赞数 1

CC 4.0 BY-SA版权

分类专栏： python 踩坑日常文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/Sky_QiaoBa_Sum/article/details/140045710

踩坑日常同时被 2 个专栏收录

18 篇文章

订阅专栏

python

5 篇文章

订阅专栏

在这里插入图片描述
读取文件时报错Unicode编码错误，一般这种情况较多是在国标码(GBK)和utf8之间选择出现了问题。

这里是官方提供的LJSPEECH文件，只读，无法修改，于是copy一份，使用自己写的文件。

改法一：

        # errors = 'ignore'
        with open(self._metadata_path, "r", newline="", errors='ignore') as metadata:
            flist = csv.reader(metadata, delimiter="|", quoting=csv.QUOTE_NONE)
            self._flist = list(flist)

改法二：

        # encoding = 'utf-8'
        with open(self._metadata_path, "r", newline="", encoding='utf-8') as metadata:
            flist = csv.reader(metadata, delimiter="|", quoting=csv.QUOTE_NONE)
            self._flist = list(flist)