我试着读入两个文本文件,一个用UTF8编码。我在PyCharm中使用python3。在
两个文件中的示例:1.
its group are in Spain .
its group are in Antarctica .
2.
sus grupos estan en España .
sus grupos estan en Antártida .
在命令行中,我使用:
^{pr2}$
把文件读入标准输入. 在
在我的代码中,我使用以下命令来读取粘贴的文件:#!/usr/bin/env python
#coding=utf8
import itertools
import sys
for fgn_sent,eng_sent in itertools.zip_longest(*[sys.stdin]*2):
print(fgn_sent)
然后我得到一个错误:Traceback (most recent call last):
File "ibm0.py", line 33, in
initialize_probabilities()
File "ibm0.py", line 13, in initialize_probabilities
for fgn_sent,eng_sent in itertools.zip_longest(*[sys.stdin]*2):
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/encodings/ascii.py", line 26, in decode
return codecs.ascii_decode(input, self.errors)[0]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 863: ordinal not in range(128)
其中第13行是上面的for...行。在