我的数据集的日期范围是2018年1月12日到8月3日,其中包含一些值:
my_df DataFrame的维度是:
my_df.shape
(9752, 2)
每行包含半小时的频率
第一行开始于2018-01-12
my_df.iloc[0]
Date: 2018-01-12 00:17:28
Value 1
Name: 0, dtype: object
最后一排结束于2018-08-03
my_df.tail(1)
Date: Value
9751 2018-08-03 23:44:59 1
我的目标是选择与每天相对应的数据行并将其导出为CSV文件.
为了获得1月12日的数据并保存到可读文件,我执行:
# Selecting data value of each day
my_df_Jan12 = my_df[(my_df['Fecha:']>='2018-01-12 00:00:00')
&
(my_df['Fecha:']<='2018-01-12 23:59:59')
]
my_df_Jan12.to_csv('Data_Jan_12.csv', sep=',', header=True, index=False)
从1月12日到8月03日有203天(28周)
我不想每天手动执行此查询,然后我尝试以下基本分析:
>我需要生成203个文件(每天1个文件)
> 1