增加一列数据并赋值
有时候可能会遇到需要增加一列数据,例如增加一列全为1的数据,方便按时间合并行过后统计次数。
df['xxx number'] = 1
两列时间相减
使用pandas求两列时间的差,也就是统计csv数据集种某个任务持续的时间
df['end time'] = pd.to_datetime(df['end time'])
df['start time'] = pd.to_datetime(df['start time'])
df['xxx time'] = (df['end time'] - df['start time']).dt.seconds/60 #两列时间的差(分钟)
先把两列时间分别转为datetime,再求差,.dt.seconds转换成秒,可以除以60转换为分钟,小时或天同理。
按时间合并且求和
前面的操作可以统计出某个任务的执行时间,我们可以通过resample()来进行一个统计,比如说统计一段时间内(10分钟等)的操作时间的总和。
df['start time'] = pd.to_datetime(df['start time'])
df.set_index('start time',inplace = True)
ticks = df.iloc[:]
df_new = ticks.resample('5min').sum()
以开始时间为索引,合并时间,统计五分钟内其他各数据之和。
其他操作
pandas操作1(读csv不要索引/写csv不要索引/删除有空值行/按时间排序)