【python数据分析】数据基础分析

学习资料:

[4.3.5]--单元小结_哔哩哔哩_bilibili

“摘要”即有损地提取数据特征的过程

1 数据的排序

  • .sort_index(axis=0,ascending=True)

在指定轴上将数据根据索引排序,默认升序

(竖着的是0轴,横着是1轴)

  • Series.sort_values(axis=0,ascending=True)

在指定轴上根据数值进行排序,默认升序

  • DataFrame.sort_values(by,axis=0,ascending=True)

by:axis轴上的某个索引或索引列表,既可以索引index也可以索引volumn

  • 在排序中,NaN统一放到排序末尾

2 数据的基本统计分析

  • 基本统计分析函数(Series和DataFrame通用)

  • .describe()

discribe方法作用于Series时,输出是一个Series类型的对象,因此可以用Series索引的方法获取对应的值

discribe方法作用于DataFrame时,输出是一个DataFrame类型的对象

如果想要获取某一列的各项统计值,可以采用.describe().ix[‘对应column的索引’]方法

  • 只适用于Series类型

3 数据的累计统计分析

  • 累计统计分析函数(Series和DataFrame通用)

默认沿着列方向进行累计统计

  • 滚动计算(窗口计算)函数 (Series和DataFrame通用)

加入.rolling(w)命令,表示在列的方向上每隔w个元素进行一次运算

4 数据的相关分析

4.1 度量两个变量相关性的方法

  • 协方差法

  • Pearson相关系数

4.2 相关分析函数

  • .cov() (Series和DataFrame通用)

  • .corr() (Series和DataFrame通用)

!!!完结撒花!!!

打算开下一个系列:

目前主要学习李沐的动手学深度学习,再搭配看一些统计学习方法的理论知识和吴恩达的机器学习课程

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值