pandas根据日期求某一列的年平均值

对于这种,读进来日期不是日期格式,并且有时候一天有很多条数据,一天没有数据的情况,根据年份合并求star_rating这一栏的平均值。
在这里插入图片描述

读入数据并删除无关列

pcfr = pd.read_excel('microwave.xlsx')
df = pcfr[['review_date','star_rating']]
df.head(3)

会警告,无视之。

df['review_date'] = pd.to_datetime(df['review_date'])

日期格式的转化

# df.set_index('review_date')
# df.reset_index()
t = df.set_index('review_date')
t.head(3)

这一步结束后可以看到日期已经转换成功。
在这里插入图片描述
利用groupby分组求年平均值

m = t.groupby(pd.Grouper(freq='Y')).mean()
print(m)

在这里插入图片描述

已标记关键词 清除标记
相关推荐
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页