UnicodeDecodeError: 'gbk' codec can't decode byte 0xe9 in position 7581: illegal multibyte sequence

  这个问题是在我在读取一段文本时出现的错误,当时的代码是这样的:
 

 def getMovieList(item):
    items = {}
    f = open(item,"r") #这句的问题
    movie_content = f.readlines()
    f.close()
    for movie in movie_content:
        movieLine = movie.split("|")
        items[int(movieLine[0])] = movieLine[1:]
    return items

这是Unicode编码不一致导致的,上面的

 f = open(item,"r")

换成

f = open(item,"r",encoding='ISO-8859-1')

就能正常运行了!

注意:
  当遇到类似的问题的时候,不一定一定都改为encoding=’ISO-8859-1’,我碰到的另外一个则是修改encoding=’utf-32’。因为unicode下面的编码方式有好几种,比如:utf-8、utf-16、utf-32、ISO-8859-1、gb2312等等好多种。但是这样的问题真的就是这么解决的。我们需要做的就是去把encoding后面的编码方式多换不同的试试,找到正确的就可以了。
下面是我找到的几种unicode编码方式:
  

gbk
gb2312
gb18030
utf-8
utf-16
utf-32
ISO-8859-1
   希望对大家有帮助哦~~~O(∩_∩)O~
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值