解决时序数据pandas groupby 按时间分组后0值填充的问题

原创已于 2023-03-02 11:04:26 修改 · 777 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#pandas

于 2023-03-02 11:02:22 首次发布

Python 专栏收录该内容

64 篇文章

订阅专栏

当使用Pandas按15分钟粒度统计时序数据，可能会遇到某些时间段的流量为0，这些记录默认不会显示在结果中。为确保完整展示所有时间间隔，可以使用`.unstack(fill_value=0).stack()`方法来填充并恢复这些0值，确保每个时间粒度都有记录。

针对时序数据按不同时间粒度统计时，如果粒度比较小比如15min会存在统计值为0，而pandas返回的dataframe默认只显示结果为非0的记录，例如下面的例子，统计门架的15min总流量和货车流量：

门架名称，时间，总流量，货车流量

XXXX，2023-01-15 00:00:00，1，0

XXXX，2023-01-15 00:30:00，1，0

中间的2023-01-15 00:15:00 总流量和货车流量都为0，那么df就默认不显示。

我们想要的结果是：

门架名称，时间，总流量，货车流量

XXXX，2023-01-15 00:00:00，1，0

XXXX，2023-01-15 00:15:00，0，0

XXXX，2023-01-15 00:30:00，1，0

如果此时需要填充，可以使用.unstack(fill_value=0).stack()，例如：

menjia=dataall.groupby(['门架名称',dataall['时间'].dt.floor('15Min')]).
agg(总流量=('车型','size'),货车流量=('车型',lambda x:len(x.loc[x=='货
车']))).unstack(fill_value=0).stack().reset_index()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

roamer314

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Pandas数据分析一览-短期内快速学会数据分析指南(文末送书)

master_hunter的博客

09-14

1963

三年耕耘大厂数据分析师，有些工具是必须要掌握的，尤其是Python中的数据分析三剑客：Pandas，Numpy和Matplotlib。就以个人经验而已，Pandas是必须要掌握的，它提供了易于使用的数据结构和数据操作工具，使得在Python中处理结构化数据变得更加简单和高效。无论是处理常用的时序数据还是处理金融数据，与各类数据库联动或者是使用各类算法进行计算分析，都离不开Pandas的数据处理支持。作为一名数据分析师几乎每天都得和Pandas打交道，所以学习Pandas避不可避，但是如何高效学习Pandas

【Python高阶开发】1. Pandas工业级时序数据处理实战：从振动传感器数据到轴承故障预警系统

07-25

1383

摘要：在工业设备健康监测中，振动传感器数据是评估设备状态的核心依据，但高频噪声干扰、数据传输缺失、多设备时间戳错位等问题严重影响分析准确性。本文基于Python Pandas构建工业级时序数据处理流水线，提出"时间校正-缺失填充-噪声过滤-特征提取"四步清洗法，针对工业场景设计专用策略：短时缺失采用线性插值、长时缺失标记异常，振动数据结合移动平均与Z-score检测保留真实特征。通过时域（峰值、峭度、RMS）与频域（傅里叶变换、频带能量）特征提取，构建轴承故障预警模型。

参与评论您还未登录，请先登录后发表或查看评论

Python Pandas实现数据分组求平均值并填充nan的示例

09-19

今天小编就为大家分享一篇Python Pandas实现数据分组求平均值并填充nan的示例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

pandas多表操作，groupby，时间操作

zhili8866的博客

03-30

1万+

多表操作 merge合并 pandas.merge可根据一个或多个键将不同DataFrame中的行合并起来 pd.merge(left, right)# 默认merge会将重叠列的列名当做键，即how='inner'，有多个重复列名则选取重复列名值都相同的行# 指定“on”作为连接键，left和right两个DataFrame必须同时存在“on”列，连接键也可N对N（少用） pd.merge(le

pandas groupby分组后对每个组进行fillna填值

小白tree的博客

07-06

4106

pandas Dataframe grouby分组填值fillna ffill bfill

mysql分组统计没有默认0_mysql group by分组查询统计数据时，在没有数据时如何自动补0...

weixin_36435829的博客

01-20

1912

问题描述查询数据库表中最近7天的记录select count(*),date(create_time) as date from task where datediff(now(),create_time)<=6 group by day(create_time);但是发现某一天没有数据，结果中没有显示当天(2017-08-28)的数据解决思路思路一：可以在自己的程序中做额外的补零处理思...

python按时间分类数据_利用Pandas和Numpy按时间戳将数据以Groupby方式分组

weixin_39752215的博客

12-16

1771

首先说一下需求，我需要将数据以分钟为单位进行分组，然后每一分钟内的数据作为一行输出，因为不同时间的数据量不一样，所以所有数据按照最长的那组数据为准，不足的数据以各自的最后一个数据进行补足。之后要介绍一下我的数据源，之前没用的数据列已经去除，我只留下要用到的数据data列和时间戳time列，时间戳是以秒计的，可以看到一共是407454行。data time0 6522.50 1.530...

Pandas（Python库）：时间序列数据处理

kkchenjj的博客

07-18

1328

时区，是地球上的一个区域采用的统一时间标准，通常基于该区域与格林尼治子午线的经度差异。全球分为24个时区，每个时区相隔15度经度，时间相差1小时。时区的引入，是为了协调不同地理位置的日期和时间，确保全球时间的一致性和可比性。在Pandas中，对象支持时区信息，这在处理跨时区的时间序列数据时尤为重要。时区信息可以使用IANA时区数据库中的时区名称来指定，如或。在Pandas中处理时间序列数据时，正确管理时区信息是确保数据准确性和一致性的关键。通过使用Timestamp对象和其相关方法，如。

pandas数据分组与聚合-时间序列-重采样

QiuBeiXianSeng的博客

09-11

1554

数据分组与聚合数据包含在Series、DataFrame数据结构中，可以根据一个或多个键分离到各个组中。分组操作之后，一个函数就可以应用到各个组中，产生新的值。如下图则是简单的分组聚合过程。 df.groupby(‘key’) key为指定分组的列 import pandas as pd import numpy as np df1 = pd.DataFrame( { "names":["菲菲","小可爱","mia","牛哥","老王","mia","狼人","药

group by 按某一时间段分组统计并查询(推荐)

01-21

工作中要求对日志表中的时间戳字段进行分组。分组的条件是，相隔 1分钟间隔的被分到一组。数据库表是这样的 SELECT COUNT(log_id) AS u_count FROM logdb.`log` GROUP BY TIMESTAMP-TIMESTAMP%(1*60) 其中timestamp 是数据库时间字段。括号中的1 是间隔时间，1分钟。如果是1小时，就写60，如果是30s 就写0.5 结果那被分组的id 如何解决呢？分完组我们还需要哪些记录被分到哪些组了。我们可以这么做。 SELECT COUNT(log_id) AS u_count ,GROUP_CONCAT

利用Pandas和Numpy按时间戳将数据以Groupby方式分组

09-19

主要介绍了利用Pandas和Numpy按时间戳将数据以Groupby方式分组，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

Pandas NAN 补0，批量操作

Kp0fS的草稿纸

01-28

1904

Pandas NAN 补0，批量操作在Pandas中，如果你想将DataFrame中的NaN（缺失值

pandas将某一列的空值补全为0