pandas数学聚合和分组运算的简单基础

最新推荐文章于 2023-02-17 20:38:26 发布

竹里清风，竹外尘

最新推荐文章于 2023-02-17 20:38:26 发布

阅读量172

点赞数

分类专栏：数据分析

本文链接：https://blog.csdn.net/qq_44210926/article/details/100997500

版权

数据分析专栏收录该内容

4 篇文章 0 订阅

订阅专栏

什么都不多说，注释里有解释

from pandas import Series,DataFrame
import numpy as np
import os

df = DataFrame({
    'a': list('abcab'),
    'b': ['b','g','g','b','g'],
    'c': np.random.randn(5),
    'd': np.random.randn(5)
})
print(df)
# 将'b'这一列拿出来,按“b”进行分组等操作
group = df.groupby(['b'])
print(group)
# group会自动去重，count()计算每组中非nan的个数
'''print(group.count())'''

# 每个组中非nan的平均值
'''print(df.groupby(['a','b']).mean())'''
# describe() 描述组内数据的基本统计量
b = ['one','two','one','two','two']
a = df.groupby(b).describe()
# 将结果保存在csv文件中，读取csv文件用read_scv()
if os.path.exists( r'C:\Users\ASUS\Desktop\python\数据分析\图片\01.csv' ) == False :
    a.to_csv(r'C:\Users\ASUS\Desktop\python\数据分析\图片\01.csv','w')
print(a)
# head(n) 获取每个组的前n行
df.groupby('b').head(2)
# transform() 的结果中属于同行名的元素的值会相同
print(df.groupby('b').transform('mean'))

竹里清风，竹外尘

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas数学聚合和分组运算的简单基础

什么都不多说，注释里有解释from pandas import Series,DataFrameimport numpy as npimport osdf = DataFrame({ 'a': list('abcab'), 'b': ['b','g','g','b','g'], 'c': np.random.randn(5), 'd': np.random...
复制链接

扫一扫

专栏目录