近期在使用python对中文文件进行读写操作时,发现读入的中文文件出现乱码现象,如图:
后查阅相关资料发现,python默认使用的uASCII编码,而中文需要使用Unicode编码,因此需要对读入的中文进行格式转换。转码命令为:
或者:
此时,读入的文本类型为unicode类型。
如果读入的文本中包含部分数据信息,则要先将对应的数据信息的类型从unicode类型转换为ascii类型,然后使用float命令将其从str类型变量转换为数值类型变量。命令如下:
float(eachline[15].encode('utf-8'))