python+SQL group by后排序取最大值/最小值

最新推荐文章于 2024-08-16 15:19:25 发布

石小秀1995

最新推荐文章于 2024-08-16 15:19:25 发布

阅读量3.1k

点赞数

分类专栏： python hive sql 文章标签： python group by 排序

本文链接：https://blog.csdn.net/weixin_43852674/article/details/94406590

版权

本文介绍了如何使用Python和SQL进行数据处理，包括根据时间取最小值的行、获取出现频次最多的行、选择最早的数据。在Python中，通过SQL的group by操作结合row_number()函数修正了获取最早date对应id的方法，同时展示了如何对数据分组求和以及在分组后去重，只保留特定条件的最小值。

摘要由CSDN通过智能技术生成

取根据时间最小值的行

# 这样得到的不是按照ts最小排序的第一行数据
# grouped=data.groupby(['t1.date','t1.imei','address']).head(1)  #43626行
grouped=data.groupby(['t1.date','t1.imei']).apply(lambda t: t[t.ts==t.ts.min()])
grouped.head()

取出现频次最多的行

# 计算address出现的频次
data['counts'] = 0
data = data.groupby(['t1.date','t1.imei','address'], as_index=False)['counts'].count()

# 取出现频次最多的行
grouped=data.groupby(['t1.date','t1.imei']).apply(lambda t: t[t.counts==t.counts.max()])

只取出现最早的数据

Python

grouped = data['time'].groupby(data['imei'])
mindf = grouped.min().to_frame()   ## 重要~~删除线格式~~ 
mindf = mindf.reset_index()
mindf.head()

SQL - row_number()

-- 活跃 
select date

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

石小秀1995

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python应用实战-sql操作groupby常用技巧

wenyusuran的专栏

07-22

1118

了，但有些小技巧还是要和大家普及一下的。为了给大家演示，我们采用一个公开的数据集进行说明。 importpandasaspd iris=pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv') 随机采样5条，数据是长这样子的。 >>>iris.sample(5) sepal_lengthsepal_widthpetal_length...

python 排序求最大值 第二最大

weixin_34199405的博客

03-25

744

nums = [6, 11, 7 ,9, 4, 2,1]i = len(nums) - 1j = 1while j < i: if nums[j] > nums[j+1]: nums[j], nums[j+1] = nums[j+1], nums[j] j += 1print(nums)lst = sorted(nums)print(ls...

参与评论您还未登录，请先登录后发表或查看评论

SQL里查询某一字段最大最小值

最新发布

m0_46159772的博客

08-16

208

函数主要用于找出某列中的最大值。它支持多种数据类型来比较大小，但主要适用于数值型（如整数、浮点数等）和日期/时间类型（如DATE、DATETIME、TIMESTAMP等）3.为了按数值大小来比较并找到最大值，你可以使用CAST(file_size AS UNSIGNED)，UNSIGNED表示非负整数。2.确定某字段数据类型，如file_size的类型是varchar字符串，你需要先将。类型的值转换为数值类型。

mysql order by , group by分组取获取最大（最小）值所在行数据

wbj16116的博客

08-05

874

转载地址

Python：对于多维groupby()透视数据，筛选保留分组的前N个最大/最小数据？

htuhxf的博客

07-24

9637

stackoverflow原文链接：这里。 Q: 我想把我的dataframe，先进行gourpby()处理、再对结果进行排序。 print(df) # df输出结果如下： count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5...

python groupby函数实现分组后选取最大值或者最小值

vergil_zsh的博客

05-02

5531

python分组之后选取最大值或最小值

SQL的聚合函数——指定列的总行数、最大值、最小值、和、平均值、聚合函数控制的处理

汪雯琦的博客

03-28

1773

文章目录1. 聚合函数的介绍指定列的总行数指定列的最大值指定列的最小值指定列的和指定列的平均值2. 求总行数3.求最大值4.求最小值5.求和6.求平均值7. 聚合函数的特点8. 小结 1. 聚合函数的介绍聚合函数又叫组函数，通常是对表中的数据进行统计和计算，一般结合分组(group by)来使用，用于统计和计算分组数据。常用的聚合函数: 指定列的总行数 count(col): 表示求指定列的总...

python 整合同类数据求分位值_【Python】GroupBy：数据聚合与分组运算

weixin_39818662的博客

12-22

1059

【博客地址】：https://blog.csdn.net/sunyaowu315【博客大纲地址】：https://blog.csdn.net/sunyaowu315/article/details/82905347python：GroupBy：数据聚合与分组运算目录：文章目录目录： @[toc]一 GroupBy技术1 对分组进行迭代2 选取一个或一组列3 通过字典或Series进行分组4 通过函...

Python-Pandas groupby后可应用函数全解析

qq_42209504的博客

07-01

2637

Python-Pandas groupby之后agg的函数最全groupby后可以应用agg或apply的函数说明1.shift和diff的应用假如你要根据A分组，计算B列的一阶差分，下面的用法是不对的，会导致分组的索引A列消失正确用法，先将需要分组的列设置为索引，然后上面level=0表示对索引进行分组，这样才会返回带分组列的正确信息2.cummax和cummin的理解，举个例子就懂了 groupby后可以应用agg或apply的函数函数解释 max 最大值 min 最小值 m

python groupby用法_Pandas之超好用的Groupby用法详解

weixin_39627390的博客

12-08

1431

在日常的数据分析中，经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析，如电商领域将全国的总销售额根据省份进行划分，分析各省销售额的变化情况，社交领域将用户根据画像(性别、年龄)进行细分，研究用户的使用情况和偏好等。在Pandas中，上述的数据处理操作主要运用groupby完成，这篇文章就介绍一下groupby的基本原理及对应的agg、transform和apply操作。为了...

mysql 取最大值_Python3与Mysql的交互之旅:pymsql学习

weixin_33577989的博客

01-12

259

python和mysql都是很好的数据分析工具，那么如何通过python来调用和执行mysql的查询语言呢？下面就以python3操作mysql的一个实际的案例来进行演示。注：我们事先已经通过Navicat for MySQL创建好了一个名为“lsc_database”的mysql数据库，该库里面有一个数据表《Online Retail.xlsx》，该数据表如下。1 任务目标编写python用sq...

python输出mysql查询最大值_mysql多分组某字段最大值获取的sql语句 | 工作实践真知分享 IT python资源,python面试,python教程，python自学，pytho...

weixin_39532754的博客

02-11

184

/*有几条device_code会列出来几条记录，确保拿到最大的update_time*/select device_code, max(update_time) as time from t_car_record group by device_code order by update_time desc视图的创建-- ------------------------------ View st...

python 中求最大值问题_Python：使用groupby获取在组中具有最大值的行

weixin_39645343的博客

11-24

482

In [1]: dfOut[1]:Sp Mt Value count0 MM1 S1 a 31 MM1 S1 n 22 MM1 S3 cb 53 MM2 S3 mk 84 MM2 S4 bg 105 MM2 S4 dgd 16 MM4 S2 rd 27 ...

python pandas获取groupby之后的数据

weixin_45144170的博客

04-12

1万+

上周，有个网友在后台提问，如何获取groupby之后的数据。后来，在网上还真找到了一种解决方法，虽然有点麻烦，但确实实现了。在这里小记录一下，供大家参考： >>> import pandas as pd # 原始数据 >>> df = pd.read_excel(r'D:/myExcel/1.xlsx') >>> df name ma...

sql语句group by找到最大值及对应的一条数据

love4amanda的博客

03-06

2549

问题所在: group by 是分组聚合行为: 具体是根据字段分组,并默认取第一行的数据(未聚合的话) 处理方式1: 子查询: 例子:需求,查同名下,最大出生日期的那条记录(所有字段) select * from (select * from tableA order by born_date desc) group by name 这里有个问题:在mysql 5.7 版本后中子查询的排序...

Python实现分组排序

qq_43278973的博客

09-29

4220

Python实现分组排序需求1：按照药品名称（ADVICE_CONTENT）分组，排序。第一种实现方式 import pandas as pd base_dire = './result/xx.csv' result_file = './result/drug_group_desc.csv' df = pd.read_csv(base_dire,engine='python',encoding='utf-8',usecols=['ADVICE_CONTENT']) #第一种方式使用size函数添加

【mysql】mysql group by分组后取每组的最小值

孟秋与你的博客

09-19

4010

mysql分组后取第一条数据

获取使用group by 分组后的组内最新(最大,最...)的一条数数据