常见的两种数据类型是datetime和timedelta。
datetime顾名思义就是既有日期date也有时间time,表示一个具体的时间点(时间戳)。2021-12-23 (date) 12:00:00 (time) ---> datetime
timedelta
则表示两个时间点之间的差,比如2020-01-01
和2020-01-02
之间的timedelta
即为一天。
将时间列转换为时间格式
data.trade_date.head()
0 20190102
1 20190103
2 20190104
3 20190107
4 20190108
Name: trade_date, dtype: object
# 运用pd.to_datetime(),可以将对应的列转换为Pandas中的datetime64类型,便于后期的处理
data["trade_date"] = pd.to_datetime(data.trade_date)
data.trade_date.head()
0 2019-01-02
1 2019-01-03
2 2019-01-04
3 2019-01-07
4 2019-01-08
Name: trade_date, dtype: datetime64[ns]
时间序列的索引
#时间序列中索引和Pandas普通的索引类似,大多时候调用.loc[index,columns]进行相应的索引
data1 = data.set_index("trade_date")
# 2019年6月的数据
data1.loc["2019-06"].head()
close open high low
trade_date
2019-06-03 2890.0809 2901.7424 2920.8292 2875.9019
2019-06-04 2862.2803 2887.6405 2888.3861 2851.9728
2019-06-05 2861.4181 2882.9369 2888.7676 2858.5719
2019-06-06 2827.7978 2862.3327 2862.3327 2822.1853
2019-06-10 2852.1302 2833.0145 2861.1310 2824.3554
# 2019年6月-2019年8月的数据
data1.loc["2019-06":"2019-08"].tail()
close