一、时序中的基本对象
在pandas中称为Timestamp。同时,一系列的时间戳可以组成DatetimeIndex,而将它放到Series中后,Series的类型就变为了datetime64[ns],如果有涉及时区则为datetime64[ns, tz]
二、时间戳
- Timestamp的构造与属性
单个时间戳的生成利用pd.Timestamp实现,一般而言的常见日期格式都能被成功地转换:
- Datetime序列的生成
一组时间戳可以组成时间序列,可以用to_datetime和date_range来生成。其中,to_datetime能够把一列时间戳格式的对象转换成为datetime64[ns]类型的时间序列:
- dt对象
如同category, string的序列上定义了cat, str来完成分类数据和文本数据的操作,在时序类型的序列上定义了dt对象来完成许多时间序列的相关操作。这里对于datetime64[ns]类型而言,可以大致分为三类操作:取出时间相关的属性、判断时间戳是否满足条件、取整操作。
第一类操作的常用属性包括:date, time, year, month, day, hour,
minute, second,
microsecond,
nanosecond,
dayofweek,
dayofyear,
weekofyear,
daysinmonth, quarter
其中daysinmonth, quarter分别表示该天所在月的总天数和季度
Ex1:太阳辐射数据集
现有一份关于太阳辐射的数据集:
- 将Data, Time合并为一个时间列Datetime,同时把它作为索引后排序。
2.2. 每条记录时间的间隔显然并不一致,请解决如下问题:找出间隔时间的前三个最大值所对应的三组时间戳。
是否存在一个大致的范围,使得绝大多数的间隔时间都落在这个区间中?如果存在,请对此范围内的样本间隔秒数画出柱状图,设置bins=50
这里一直报错,还在解决中。。。。。
- 求如下指标对应的Series:
温度与辐射量的6小时滑动相关系数
以三点、九点、十五点、二十一点为分割,该观测所在时间区间的温度均值序列
每个观测6小时前的辐射量(一般而言不会恰好取到,此时取最近时间戳对应的辐射量)
考试周打卡。。。。。。。