1、问题背景
每日有多条信息,即 updateTime 栏每天有多条,现需要按照国家、日期分组,只保留最后更新的一条数据。
2、代码
import pandas as pd
data = pd.read_csv('test.csv',header = 0)
df = pd.DataFrame(data)
df = df.sort_values('updateTime', ascending=False).groupby(['countryName','date']).first().reset_index()
以上,问题解决~