1、pandas 读取数据
import pandas as pd
data = pd.read_table('Z:/test.txt',header=None,encoding='gb2312',delim_whitespace=True,index_col=0)
#header=None:没有每列的column name,可以自己设定
#encoding='gb2312':其他编码中文显示错误
#delim_whitespace=True:用空格来分隔每行的数据
#index_col=0:设置第1列数据作为index
data.columns = ['name','pass','len']#设置列名
b=data.drop_duplicates(['name'])#以name删除重复行
lc=pd.DataFrame(b)
lc=lc.sort_values(["pass"],ascending=False)#以pass列排序
lc.to_csv('finally.csv',encoding='gb2312')#输出excel格式