pandas与numpy

这篇博客深入探讨了Pandas库中的分组计算、统计计算、表的组合及数据透视功能,同时介绍了Numpy的基本操作,如数组array、随机数生成、索引和数学计算,是Python数据分析的重要参考资料。
摘要由CSDN通过智能技术生成

Pandas

分组计算

groupby用法

df.type1.value_counts() # 输出“type1”这一列不同元素的数量

grouped=df.groupby('type1')  # 按照某一列的元素来分组
grouped.size() # 输出“type1”这一列不同元素的数量
grouped.groups # 列举每个组内的索引
len(grouped) # 输出总组数

统计计算

grouped.sum()  # 以分组的列为索引,求总和
grouped.mean()  # 以分组的列为索引,求平均值
grouped['against_bug'].std()  # 以分组的列为索引,求某一列的标准值
import numpy as np
grouped.agg([np.mean,np.sum,np.std])   #agg()函数可以同时运算多个统计量
grouped.agg({
   'against_bug':np.mean,'against_dark':np.sum,'against_dragon':np.std})  #不同列计算不同统计量,应用字典

表的组合

pd.concat([df1,df2,df3])   # df1,df2,df3为三个列表,concat()函数用于将含有相同列名的多个列表联合起来

函数merge()一次只能组合两张表

pd.merge(df1,df2,on=['C','D']) # 用于将 只有部分列名相同的多个列表合并起来,合并的列元素必须完全相同,on=相同的列名
pd.merge(df1,df3,how='left',on=['C','D'])  #合并的列元素可以不同,how决定以左边/右边为主
pd.merge(df1,df3,how='outer',on=['C','D'])  # 全部显示出来,不相同的部分不结合

df1.set_index(['C','D']
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值