菜鸟分析数据


数据分析 

在Pandas中,SQL的GROUP BY操作是使用类似命名的 groupby()方法执行的。groupby()通常是指我们想要将数据集分成组,应用某个函数(通常是聚合),然后将这些组合在一起的过程。


读入测试数据

大部分的例子将利用tips在pandas测试中发现数据集。我们将数据读入一个名为tips的DataFrame,并假设我们有一个同名和结构的数据库表。


一个常见的SQL操作将获得整个数据集中每个组的记录数。例如,一个查询让我们知道性别留下的提示的数量:

Pandas等价表达

请注意,在我们使用的Pandas代码size()而不是 count()这是因为 count()对每列应用函数,返回每个列中not null记录

或者,我们可以将该count()方法应用于单个列:

也可以一次应用多个功能。例如,假设我们希望看到每天的小费金额有多少 - agg()允许将字典传递到分组的DataFrame,指出哪些函数适用于特定的列。

通过将列列表传递给groupby()方法来完成由多个列组成的分组 

今日赠言


一个人做事情的时候不仅容易放弃,而且你的成长也是有限的。你需要团队的力量帮助你成长,你需要集体的智慧帮助你进阶。不要害怕和别人沟通,也许就是因为你不经意的哪一句话,帮助你羽化成蝶,人生灿烂如花。



推荐阅读:


机器学习篇

机器学习入门科普篇--系列二

机器学习算法的随机数据生成总结

python 数据清洗篇

python 数据清洗篇

想入门深度学习?先理解这25个概念!

自然语言处理中的Attention Model:是什么及为什么

用户画像之用户性别识别

机器学习入门科普篇--系列一

客户流失分析

全球变暖温度分析图

数据挖掘学习笔记--决策树C4.5

决策树你应该知道的几点

决策树的Python实现

机器学习之------K-Means(K均值)

机器学习算法与Python实践之(一)k近邻(KNN)

数据科学的完整学习路径

对线性回归、逻辑回归、各种回归的概念学习


python学习篇

优雅的Python

利用python操作Excel教程

让你的 Python 代码优雅又地道

Python笔记

python学习笔记

Python小知识:Python 迭代器与生成器

python函数简书

Python常用模块资料

Python 禅道

Python 字符串操作方法大全

Python的编码命名规则

python 数组的del ,remove,pop区别



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值