AttributeError: module ‘pandas‘ has no attribute ‘TimeGrouper‘

最新推荐文章于 2024-06-02 09:25:47 发布

赵孝正

最新推荐文章于 2024-06-02 09:25:47 发布

阅读量1.7k

点赞数 3

分类专栏：利用Python进行数据分析文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/weixin_46713695/article/details/125416153

版权

利用Python进行数据分析专栏收录该内容

18 篇文章 0 订阅

订阅专栏

这篇博客介绍了如何在pandas中处理时间序列数据，通过`resample`函数实现按'key'和时间间隔进行数据分组并求和。首先创建了一个包含'time'、'key'和'value'的DataFrame，然后设置了时间索引，利用'resample'对象按5分钟间隔对数据进行重采样，最后展示了解采样的结果。

摘要由CSDN通过智能技术生成

要为每个’key’的值进行相同的重新采样，我们可以使用pandas.TimeGrouper对象：报错

import pandas as pd
import numpy as np

N = 15
times = pd.date_range('2017-05-20 00:00', freq='1min', periods=N)
df2 = pd.DataFrame({'time': times.repeat(3), 'key': np.tile(['a', 'b', 'c'], N), 'value': np.arange(N * 3.)})
time_key = pd.TimeGrouper('5min')
resampled = (df2.set_index('time').groupby(['key', time_key]).sum())

输出：

AttributeError: module 'pandas' has no attribute 'TimeGrouper'

修改后：
之后我们可以设置时间索引，按’key’和time_key进行分组，再聚合：

from pandas.core import resample as rp
time_key = rp.TimeGrouper('5min')
resampled = (df2.set_index('time')
             .groupby(['key', time_key])
             .sum())
resampled

输出：

Out[12]: 
                         value
key time                      
a   2017-05-20 00:00:00   30.0
    2017-05-20 00:05:00  105.0
    2017-05-20 00:10:00  180.0
b   2017-05-20 00:00:00   35.0
    2017-05-20 00:05:00  110.0
    2017-05-20 00:10:00  185.0
c   2017-05-20 00:00:00   40.0
    2017-05-20 00:05:00  115.0
    2017-05-20 00:10:00  190.0