我仍然无法用年,月,日和小时的分隔列解析日期.我的数据看起来像这样(第0列是ID,第一个是年份,第二个是月份,第三个是日,第四个是小时,第五个是值)
50136 2011 1 1 21 9792
50136 2011 1 1 22 9794
50136 2011 1 1 23 9796
50136 2011 1 1 0 9798
50136 2011 1 1 1 9799
50136 2011 1 1 2 9802
我试过以下:
df = pd.read_csv(file,parse_dates = {‘date’:[1,2,3,4]} ,, index_col =’date’),但后来我得索引不是时间戳而是unicode(?)
In [17]: print df.head()
Out [17]:
0 5
date
2011 1 1 21 50136 9792
2011 1 1 22 50136 9794
2011 1 1 23 50136 9796
2011 1 1 0 50136 9798
2011 1 1 1 50136 9799
In [18]: print df.index
Out [18]:
Index([u'2011 1 1 21', u'2011 1 1 22', u'2011 1 1 23', u'2011 1 1 0', u'2011 1 1 1', u'2011 1 1 2'], dtype=object)
我显然做错了什么,但我无法弄清楚.任何建议都非常感谢.
解决方法:
如果常规方法不起作用,您可以