在前面的章节有稍微说明了下在数据分析中对日期时间是有很大的关联的,销售数据跟日期有关系,日活跟时间有关系,在进行数据统计时很多时候得先确定时间或者是某一段时间。
例如需要计算上个月的时间数据:
import pandas as pd
import datetime
start = datetime.datetime(2018, 1, 1)
end = datetime.datetime(2018, 2, 1) - datetime.timedelta(days=1)
indexs = pd.date_range(start, end)
for index in indexs:
print index
得到2018年1月份的日期:
2018-01-01 00:00:00
2018-01-02 00:00:00
2018-01-03 00:00:00
2018-01-04 00:00:00
2018-01-05 00:00:00
2018-01-06 00:00:00
2018-01-07 00:00:00
2018-01-08 00:00:00
2018-01-09 00:00:00
2018-01-10 00:00:00
2018-01-11 00:00:00
2018-01-12 00:00:00
2018-01-13 00:00:00
2018-01-14 00:00:00
2018-01-15 00:00:00
2018-01-16 00:00:00
2018-01-17 00:00:00
2018-01-18 00:00:00
2018-01-19 00:00:00
2018-01-20 00:00:00
2018-01-21 00:00:00
2018-01-22 00:00:00
2018-01-23 00:00:00
2018-01-24 00:00:00
2018-01-25 00:00:00
2018-01-26 00:00:00
2018-01-27 00:00:00
2018-01-28 00:00:00
2018-01-29 00:00:00
2018-01-30 00:00:00
2018-01-31 00:00:00
从某一天开始,生成4天的日期序列:
import pandas as pd
indexs = pd.date_range('01/01/2018', periods= 4)
for index in indexs:
print index
接下来的4天日期:
2018-01-01 00:00:00
2018-01-02 00:00:00
2018-01-03 00:00:00
2018-01-04 00:00:00
也可以按时期生成,比如按月,每月一次,生成月报表:
import pandas as pd
indexs = pd.period_range('01/2018', periods= 4,freq= 'm')
for index in indexs:
print index
月报表:
2018-01
2018-02
2018-03
2018-04
可以把时期按季度生成,把频率换成季度,freq= 'q'
:
四个季度:
2018Q1
2018Q2
2018Q3
2018Q4