‘gbk’ codec can’t encode character ‘\u301c’ in position 12: illegal multibyte sequence 解决 办法
这个问题估计是使用windows系统处理ubuntu代码引起的。
windows下读取的gbk格式,代码需要的是utf-8格式。
解决 办法:增加 encoding = ‘utf-8’
将
open(conv_path)
seq_train.write(seq[i]+'\n')
改为
open(conv_path,encoding='utf-8')
seq_train.write(seq[i]+'\n',encoding = 'utf-8')