将日期列解析为pandas Timestamps/numpy datetime64非常重要。最好的方法是使用tou-datetime和一个格式。在In [11]: df
Out[11]:
DATE TMAX TMIN
0 20110706 317 211
1 20110707 322 211
2 20110708 317 211
3 20110709 322 211
4 20110710 328 222
5 20110711 333 244
6 20110712 356 250
7 20110713 356 222
8 20110801 344 228
9 20110802 356 200
10 20110803 367 200
11 20110804 361 228
In [12]: df["DATE"] = pd.to_datetime(df["DATE"], format="%Y%m%d")
In [13]: df
Out[13]:
DATE TMAX TMIN
0 2011-07-06 317 211
1 2011-07-07 322 211
2 2011-07-08 317 211
3 2011-07-09 322 211
4 2011-07-10 328 222
5 2011-07-11 333 244
6 2011-07-12 356 250
7 2011-07-13 356 222
8 2011-08-01 344 228
9 2011-08-02 356 200
10 2011-08-03 367 200