在python中使用pandas更改现有数据帧中的头行时遇到问题。导入pandas和csv文件后,我将一个标题行设置为None,以便能够在转置后删除重复的日期。但是这会留下一个我不想要的行标题(实际上是一个索引列)。df = pd.read_csv(spreadfile, header=None)
df2 = df.T.drop_duplicates([0], take_last=True)
del df2[1]
indcol = df2.ix[:,0]
df3 = df2.reindex(indcol)
但是,上述缺乏想象力的代码在两个方面失败。索引列现在是必需的,但是所有条目现在都是NaN。我对python的理解还不足以识别python在做什么。下面的输出是我所需要的,任何帮助将不胜感激!
重新编制索引之前的df2:0 2 3 4 5
0 NaN XS0089553282 XS0089773484 XS0092157600 XS0092541969
1 01-May-14 131.7 165.1 151.8 88.9
3 02-May-14 131 164.9 151.7 88.5
5 05-May-14 131.1 165 151.8 88.6
7 06-May-14 129.9 163.4 151.2 87.1
重新编制索引后的df2:0 2 3 4 5
0
NaN NaN NaN NaN NaN NaN
01-May-14 NaN NaN NaN NaN NaN
02-May-14 NaN NaN NaN NaN NaN
05-May-14 NaN NaN NaN NaN NaN
06-May-14 NaN NaN NaN NaN NaN
所需df2:XS0089553282 XS0089773484 XS0092157600 XS0092541969
01-May-14 131.7 165.1 151.8 88.9
02-May-14 131 164.9 151.7 88.5
05-May-14 131.1 165 151.8 88.6
06-May-14 129.9 163.4 151.2 87.1