python数据分析之数据的查询【高级篇】

一、数据的分组和聚合运算

1.聚合函数(按照性别字段来分组)

(1)第一种方法

# coding:utf-8
"""
@Function:数据的分组和聚合
@Author  :王育红
@Date    :2020/8/28
"""
import pandas as pd

data = {
   'Id': ['000001', '000002', '000003', '000004', '000005', '000006', '000007'],
        'name': ['袁晓莉', '孙菁', '王育红', '马天宇', '易烊千玺', '杨颖', '郑凯'],
        'gender': [False, False, False, True, True, False, True],
        'age': [18, 21, 20, 18, 19, 17, 26],
        'height': [1.80, 1.67, 1.83, 1.80, 1.78, 1.66, 1.86]
        }
frame = pd.DataFrame(data)


# 聚合函数(一)按照性别字段来分组
groups = frame.groupby(frame['gender'])
print(groups['gender'].count())
  • 查看运行结果:
    数出女生有4人,男生有3人

(2)第二种方法

[[‘gender’]]列表参数

groups = frame[['gender']].groupby(frame['gender'])
print(groups.count().rename(columns={
   'gender':'genderCount'}))
  • 查看运行结果
    在这里插入图片描述

2.按照年龄计算人数

# 按照年龄分人数
groups = frame[['age']].groupby(frame['age'])
print(groups.count().rename(columns={
   'age':'相同年龄的人数'}))
  • 查看运行结果:
    在这里插入图片描述

3.多个列来分组

# 按照年龄和性别来分组,统计各个数量
print(frame[['Id']].groupby([frame['gender'],frame['age']]).count().
      sort_values(by=['gender','age'],ascending=[False,True]))
  • 查看运行结果:
    在这里插入图片描述

4.平均值mean()函数


 # 平均值mean()函数
print(frame[['height']].groupby([frame['gender'],frame[
  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值