解决UnicodeDecodeError:‘ascii’ codec can’t decode byte 0xe2 in position 123: ordinal not in range(128)
dictionary dumped to data/dictionary.pkl
loading dictionary from data/dictionary.pkl
Traceback (most recent call last):
File "create_dictionary.py", line 94, in <module>
weights, word2emb = create_glove_embedding_init(d.idx2word, glove_file)
File "create_dictionary.py", line 65, in create_glove_embedding_init
entries = f.readlines()
File "/root/anaconda3/envs/pt/lib/python3.6/encodings/ascii.py", line 26, in decode
return codecs.ascii_decode(input, self.errors)[0]
在源代码的64行,采用默认的读取方式。
默认情况下,代码尝试使用“ ASCII”解码文件,但失败。相反,可以明确指出要使用哪个。一般是因为系统都装有python2和Python3导致的。
因此只需将64行的代码中加入 encoding=“utf-8” ,指定编码方式即可。