这个问题是在我在读取一段文本时出现的错误,当时的代码是这样的:
def getMovieList(item):
items = {}
f = open(item,"r") #这句的问题
movie_content = f.readlines()
f.close()
for movie in movie_content:
movieLine = movie.split("|")
items[int(movieLine[0])] = movieLine[1:]
return items
这是Unicode编码不一致导致的,上面的
f = open(item,"r")
换成
f = open(item,"r",encoding='ISO-8859-1')
就能正常运行了!
注意:
当遇到类似的问题的时候,不一定一定都改为encoding=’ISO-8859-1’,我碰到的另外一个则是修改encoding=’utf-32’。因为unicode下面的编码方式有好几种,比如:utf-8、utf-16、utf-32、ISO-8859-1、gb2312等等好多种。但是这样的问题真的就是这么解决的。我们需要做的就是去把encoding后面的编码方式多换不同的试试,找到正确的就可以了。
下面是我找到的几种unicode编码方式:
gbk
gb2312
gb18030
utf-8
utf-16
utf-32
ISO-8859-1
希望对大家有帮助哦~~~O(∩_∩)O~