Python数据聚合的方法

工业互联网

已于 2022-04-24 00:27:48 修改

阅读量2.3k

点赞数 1

分类专栏： Python基础文章标签： python

于 2022-04-23 23:54:39 首次发布

本文链接：https://blog.csdn.net/weixin_45586124/article/details/124373102

版权

Python基础专栏收录该内容

32 篇文章 5 订阅

订阅专栏

本文主要讲解Python中的数据聚合的函数，函数主要由两个：size（），count（）；

size 跟 count 的区别：

1、count()方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置，size()函数主要是用来统计矩阵元素个数，或矩阵某一维上的元素个数的函数。

2、size 计数时包含 NaN 值，而 count 不包含 NaN 值；


#Python数据聚合的方法
import numpy as np
import pandas as pd
#数据聚合的方法有两个;size(),count();
#定义矩阵
df = pd.DataFrame({"Name":["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"],
                   "City":["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"],
                   "Val":[4,3,3,np.nan,np.nan,4]})

s=df.groupby(["Name", "City"],as_index=False)['Val'].count()
print(s)

s1 = df.groupby(["Name", "City"])['Val'].size().reset_index(name='s')
print(s1)

结果：

根据以上结果我们可以看到，count（）函数，对于val列为空的行没有展示。

其中：groupby函数主要的作用是进行数据的分组以及分组后地组内运算，在前文中已有描述！，用法如下：

df[](指输出数据的结果属性名称).groupby([df[属性],df[属性])(指分类的属性，数据的限定定语，可以有多个).mean()(对于数据的计算方式——函数名称)

工业互联网

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python数据聚合的方法

本文主要讲解Python中的数据聚合的函数，函数主要由两个：size（），count（）；size 跟 count 的区别：1、count()方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置，size()函数主要是用来统计矩阵元素个数，或矩阵某一维上的元素个数的函数。2、size 计数时包含 NaN 值，而 count 不包含 NaN 值；#Python数据聚合的方法import numpy as npimport pandas as pd#数据聚合
复制链接

扫一扫