Python数据聚合的方法

本文主要讲解Python中的数据聚合的函数,函数主要由两个:size(),count();

size 跟 count 的区别:

1、count()方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置,size()函数主要是用来统计矩阵元素个数,或矩阵某一维上的元素个数的函数。

2、size 计数时包含 NaN 值,而 count 不包含 NaN 值 ;


#Python数据聚合的方法
import numpy as np
import pandas as pd
#数据聚合的方法有两个;size(),count();
#定义矩阵
df = pd.DataFrame({"Name":["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"],
                   "City":["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"],
                   "Val":[4,3,3,np.nan,np.nan,4]})

s=df.groupby(["Name", "City"],as_index=False)['Val'].count()
print(s)

s1 = df.groupby(["Name", "City"])['Val'].size().reset_index(name='s')
print(s1)

结果:

根据以上结果我们可以看到,count()函数,对于val列为空的行没有展示。

其中:groupby函数主要的作用是进行数据的分组以及分组后地组内运算,在前文中已有描述!,用法如下:

df[](指输出数据的结果属性名称).groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值