pandas与numpy

最新推荐文章于 2024-04-30 17:09:26 发布

小梓菡

最新推荐文章于 2024-04-30 17:09:26 发布

阅读量125

点赞数

文章标签： python numpy 数据分析列表

本文链接：https://blog.csdn.net/xiaokeaiuiya/article/details/108715296

版权

这篇博客深入探讨了Pandas库中的分组计算、统计计算、表的组合及数据透视功能，同时介绍了Numpy的基本操作，如数组array、随机数生成、索引和数学计算，是Python数据分析的重要参考资料。

摘要由CSDN通过智能技术生成

Pandas

分组计算

groupby用法

df.type1.value_counts() # 输出“type1”这一列不同元素的数量

grouped=df.groupby('type1')  # 按照某一列的元素来分组
grouped.size() # 输出“type1”这一列不同元素的数量
grouped.groups # 列举每个组内的索引
len(grouped) # 输出总组数

统计计算

grouped.sum()  # 以分组的列为索引，求总和
grouped.mean()  # 以分组的列为索引，求平均值
grouped['against_bug'].std()  # 以分组的列为索引，求某一列的标准值
import numpy as np
grouped.agg([np.mean,np.sum,np.std])   #agg()函数可以同时运算多个统计量
grouped.agg({
   'against_bug':np.mean,'against_dark':np.sum,'against_dragon':np.std})  #不同列计算不同统计量，应用字典

表的组合

pd.concat([df1,df2,df3])   # df1,df2,df3为三个列表，concat()函数用于将含有相同列名的多个列表联合起来

函数merge()一次只能组合两张表

pd.merge(df1,df2,on=['C','D']) # 用于将 只有部分列名相同的多个列表合并起来，合并的列元素必须完全相同，on=相同的列名
pd.merge(df1,df3,how='left',on=['C','D'])  #合并的列元素可以不同，how决定以左边/右边为主
pd.merge(df1,df3,how='outer',on=['C','D'])  # 全部显示出来，不相同的部分不结合

df1.set_index(['C','D']

最低0.47元/天解锁文章

小梓菡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas与numpy

Pandas分组计算groupby用法df.type1.value_counts() # 输出“type1”这一列不同元素的数量grouped=df.groupby('type1') # 按照某一列的元素来分组grouped.size() # 输出“type1”这一列不同元素的数量grouped.groups # 列举每个组内的索引len(grouped) # 输出总组数统计计算grouped.sum() # 以分组的列为索引，求总和grouped.mean() # 以分组的列
复制链接

扫一扫