pandas 学习笔记二

该博客详细介绍了Pandas库在Python中的数据处理和统计分析技巧,包括使用sum、mean等约简方法,cumsum等累计型统计,describe等汇总统计以及缺失数据的处理,如dropna和fillna。此外,还探讨了层次化索引的概念,如swaplevel和sort_index,以及如何根据索引进行汇总计算。
摘要由CSDN通过智能技术生成

笔记来源:利用python进行数据分析【Wes Mckinnney著,唐学韬等译】

一、汇总和计算描述统计

pandas对象拥有一组常用的数学和统计方法,大部分属于约简和汇总统计,用于从Series中提取单个值(如sum、mean)或从DataFrame的行或列中提取一个Series.

1、相关示例

(1) 常用约简方法(sum()、mean()等)

约简方法的常见选项:

选项 说明
axis 约简的轴
skipna 默认为True.即默认排除缺失值
level 若轴是层次化索引(即MultiIndex),则根据level分组约简

 

间接统计(idxmax())

(2) 累计型【如cumsum()】

(3) 汇总统计【如describe()】

(4)常见的汇总描述统计

<
方法 说明
count 计算样本值中非NA值的数量
describe 针对Series或各DataFrame列计算汇总统计
min、max 计算样本值的最小值、最大值
argmin、argmax 计算能够获取到最小值、最大值的索引位置(整数)
idxmin、idxmax 计算能够获取到最小值、最大值的索引值
quantile 计算样本值的分位数(0到1)
sum 计算样本值的总和
mean 计算样本值的平均数
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值