菜鸟分析数据

最新推荐文章于 2023-02-06 08:29:33 发布

Python技术博文

最新推荐文章于 2023-02-06 08:29:33 发布

阅读量458

点赞数

数据分析　

在Pandas中，SQL的GROUP BY操作是使用类似命名的 groupby()方法执行的。groupby()通常是指我们想要将数据集分成组，应用某个函数（通常是聚合），然后将这些组合在一起的过程。

读入测试数据

大部分的例子将利用tips在pandas测试中发现的数据集。我们将数据读入一个名为tips的DataFrame，并假设我们有一个同名和结构的数据库表。

一个常见的SQL操作将获得整个数据集中每个组的记录数。例如，一个查询让我们知道性别留下的提示的数量：

Pandas等价表达：

请注意，在我们使用的Pandas代码size()而不是 count()。这是因为 count()对每列应用函数，返回每个列中not null的记录数。

或者，我们可以将该count()方法应用于单个列：

也可以一次应用多个功能。例如，假设我们希望看到每天的小费金额有多少 - agg()允许将字典传递到分组的DataFrame，指出哪些函数适用于特定的列。

通过将列列表传递给groupby()方法来完成由多个列组成的分组。

今日赠言

一个人做事情的时候不仅容易放弃，而且你的成长也是有限的。你需要团队的力量帮助你成长，你需要集体的智慧帮助你进阶。不要害怕和别人沟通，也许就是因为你不经意的哪一句话，帮助你羽化成蝶，人生灿烂如花。

推荐阅读：

机器学习篇

机器学习入门科普篇--系列二

机器学习算法的随机数据生成总结

python 数据清洗篇

python 数据清洗篇

想入门深度学习？先理解这25个概念！

自然语言处理中的Attention Model：是什么及为什么

用户画像之用户性别识别

机器学习入门科普篇--系列一

客户流失分析

全球变暖温度分析图

数据挖掘学习笔记--决策树C4.5

决策树你应该知道的几点

决策树的Python实现

机器学习之------K-Means（K均值）

机器学习算法与Python实践之（一）k近邻（KNN）

数据科学的完整学习路径

对线性回归、逻辑回归、各种回归的概念学习

python学习篇

优雅的Python

利用python操作Excel教程

让你的 Python 代码优雅又地道

python学习笔记

Python小知识：Python 迭代器与生成器

python函数简书

Python常用模块资料

Python 字符串操作方法大全

Python的编码命名规则

python 数组的del ,remove,pop区别

Python技术博文

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
菜鸟分析数据

数据分析　在Pandas中，SQL的GROUP BY操作是使用类似命名的 groupby()方法执行的。groupby()通常是指我们想要将数据集分成组，应用某个函数（通常是聚合），然后将这些组合在一起的过程。读入测试数据大部分的例子将利用tips在pandas测试中发现的数据集。我们将数据读入一个名为tips的DataFrame，并假设我们有一个同名和结构的数据库表。一个常见的SQL操作将获得整
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。