原始数据是 dataframe 的一列 “timestamp” 需要按照每5分钟做一次切分,下面是切分的代码:
import pandas as pd
def dataframe_strip(dataframe: pd.DataFrame):
min_time = dataframe['timestamp'].min()
# 5minute
i = 1
while True:
# 300是 5分钟*60秒 = 300秒
yield dataframe[(dataframe['timestamp'] - (float(min_time) + 300 * i)) < 0]
dataframe= dataframe[(dataframe['timestamp'] - (float(min_time) + 300 * i)) >= 0]
i += 1
if dataframe.empty:
break
# 使用方法:
for sp_dataframe in dataframe_strip(dataframe):
#对切分后的 sp_dataframe 的操作
pass