Pandas 入门

Pandas数据结构

        Series和DataFrame

        series的数据结构,呃,不多说,直接看

        

values表示值,index表示索引

 自主创建索引

根据索引查看值

应用数学函数选择值

对整个数据表做操作

检查某元素是否再series里

通过字典生成Series

index里有而原字典里没有的,以NaN替代,就是没有数据

index里没有的,也不会有

 那么对于DataFrame呢

        先创建一个试试:

用head方法,他会展示前5行

通过loc选取frame里的某一行

通过del删除一列

 

转置操作

        基本功能

reindex重建索引

ffill在重建索引时插值

 

reindex方法的参数

参数描述
method插值方式  "ffill"向前填充  "bfill"向后填充
fill_value通过重新索引引入缺失数据时使用的替代值
limit向前/后填充时,所需填充的最大尺寸间隙
tolerance所需填充的不精确匹配下的最大尺寸间隙
level匹配MultiIndex级别的简单索引,否则选择子集
copy为True  总是复制底层数据    False 那肯定是不复制的啦

 轴向上删除条目drop

索引,选择与过滤 

描述性统计的概述和计算 

若向sum()方法传递axis="columns"或axis=1

会将一行上各个列的值相加

归约方法可选参数

方法描述
axis归约轴,0为行,1为列
skipna排除缺失值,默认为True
level若轴是多层索引的,该参数可以缩减分组层级

描述性统计和汇总统计

方法描述
count非NA的值
describe计算各列的汇总统计集合
min,max计算最小值,最大值
argmin,argmax最小值,最大值所在的索引
idxmin,idxmax最小值,最大值所在的标签
quantile样本从0到1的分位数
sum
mean均值
median中位数
mad平均值的平均绝对偏差
prod累积
var样本方差
std样本标准差
skew样本偏度值
kurt样本峰度值
cumsum累计值
cummin,cummax累计值的最小/最大
cumprod累计积
diff计算第一个算术差值
pct_change计算百分比

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

River Chandler

谢谢,我会更努力学习工作的!!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值