(1)、在windows下的csv文件,默认打开方式是GBK格式,在linux下打开的文件默认是utf-8的格式。所以windows下的格式在linux下会出现中文乱码的现象。使用iconv命令对整个文件进行转码的操作。
sudo iconv -f GBK -t UTF-8 d_train_20180102.csv -o new_d_train.csv
后面的第一个csv为需要转码操作的文件,后面的为生成的新文件。
(2)、对xls文件的内容操作
import xlrd
data = xlrd.open_workbook('data.xls')
grade = []
lik = []
sheet = data.sheet_by_index(0) #此语句可以将xls按照索引进行查找
s = '优秀' #判断