内置函数的数据聚合&Numpy&Pandas

9 篇文章 1 订阅
8 篇文章 3 订阅

内置函数的数据聚合

实验环境

Python 3.6.1
Jupyter

实验内容
数据聚合函数的应用

代码部分

import numpy as np
import pandas as pd

1.创建六行五列的随机整数DataFrame对象,列索引为:A-E,行索引为:1,2,3,4,50,51整数范围1-8

df1 = pd.DataFrame(np.random.randint(1,8,(6,5)),columns=list('ABCDE'),index=['1','2','3','4','50','51'])
df1
ABCDE
153361
242255
341336
466643
5055742
5157155

2.按照A列分组,求出每一组的最小值

A = df1.groupby('A')
A
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001EAD736E5E0>
for i in A:
    print(i)
    print('**************')
(4,    A  B  C  D  E
2  4  2  2  5  5
3  4  1  3  3  6)
**************
(5,     A  B  C  D  E
1   5  3  3  6  1
50  5  5  7  4  2
51  5  7  1  5  5)
**************
(6,    A  B  C  D  E
4  6  6  6  4  3)
**************
A.min(1)
BCDE
A
41235
53141
66643

3.按照行索引的长度分组,求出每一组的最大值

a = df1.groupby(len)a
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001EADA6624C0>
for i in a:    print(i)    print('********')
(1,    A  B  C  D  E1  5  3  3  6  12  4  2  2  5  53  4  1  3  3  64  6  6  6  4  3)********(2,     A  B  C  D  E50  5  5  7  4  251  5  7  1  5  5)********
a.max()
ABCDE
166666
257755

4.按照列表[‘No1’,‘No2’,‘No2’,‘No1’,‘No1’]进行列分组,求出每一组的和

list1 = ['No1','No2','No2','No1','No1']list1
['No1', 'No2', 'No2', 'No1', 'No1']
b = df1.groupby(list1,axis=1)b
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001EADA662DF0>
for i in b:    print(i)    print('**********************')
('No1',     A  D  E1   5  6  12   4  5  53   4  3  64   6  4  350  5  4  251  5  5  5)**********************('No2',     B  C1   3  32   2  23   1  34   6  650  5  751  7  1)**********************
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

余生羁绊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值