最近在处理跟时间相关的数据,用到了pandas中的datetime的几个函数,本篇来说一下pandas中几个常见的时间序列生成函数。
-
pd.date_range函数
pd.date_range(start=None, end=None, periods=None, freq=None, tz=None, normalize=False, name=None, closed=None)
先来讲一下各参数的含义:
- start:即开始时间,得是字符形式的,如"2020-1-9";
- end:结束时间,格式同start;
- periods:生成的时间个数;
- freq:生成时间的间隔频率,不写默认“D”;我列出常用的几个:
freq别称 说明/以下述为频率 B 工作日 C 自定义工作日 D 日历的日期 W 周 M 月末 Q 季度末 Y 年末 H 小时 T 分钟 S 秒 MS 月初 QS 季度初 YS 年初 SMS 前半月(1号和15号) - tz:设置时区,如设置上海时间–“Asia/Shanghai”;
- normalize:是否在生成序列前将start或end的日期设为凌晨00点;默认False;
- name:设置该时间序列的名称;
- closed:有三个值–None、left、right,设置是否为闭区间,默认为None,全闭。
接着可以看一个示例:
date = pd.date_range(start="2019-9-15", periods=7, freq="2SMS", tz=