在获取数据时,如何获取最新的一笔数据呢?下面举例说明如果使用groupby函数。
在此之前,我们需要先检查判断的日期列(数值)格式是否是我们需要的东西.使用data.info()函数
我们需要将其转换为日期格式,这样才能进行基础运算的判断,使用datetime函数:
data['提交答卷时间']=pd.to_datetime(data['提交答卷时间'])
转换后格式为:
这样我们就可以进行大小的判断了
idx=data.groupby(['姓名'])['提交答卷时间'].transform(max)
#如果基于两个条件判断,如姓名班级都一致保留最新
#idx=data.groupby(['姓名','班级'])['提交答卷时间'].transform(max)
idx1 = idx == data['提交答卷时间']
#输出是否为最新资料,也可以输出最后提交时间(idx)
data['最新'] = idx1
data1 = data[data["最新