学习资料:
“摘要”即有损地提取数据特征的过程
1 数据的排序
.sort_index(axis=0,ascending=True)
在指定轴上将数据根据索引排序,默认升序
(竖着的是0轴,横着是1轴)
Series.sort_values(axis=0,ascending=True)
在指定轴上根据数值进行排序,默认升序
DataFrame.sort_values(by,axis=0,ascending=True)
by:axis轴上的某个索引或索引列表,既可以索引index也可以索引volumn
在排序中,NaN统一放到排序末尾
2 数据的基本统计分析
基本统计分析函数(Series和DataFrame通用)
.describe()
discribe方法作用于Series时,输出是一个Series类型的对象,因此可以用Series索引的方法获取对应的值
discribe方法作用于DataFrame时,输出是一个DataFrame类型的对象
如果想要获取某一列的各项统计值,可以采用.describe().ix[‘对应column的索引’]方法
只适用于Series类型
3 数据的累计统计分析
累计统计分析函数(Series和DataFrame通用)
默认沿着列方向进行累计统计
滚动计算(窗口计算)函数 (Series和DataFrame通用)
加入.rolling(w)命令,表示在列的方向上每隔w个元素进行一次运算
4 数据的相关分析
4.1 度量两个变量相关性的方法
协方差法
Pearson相关系数
4.2 相关分析函数
.cov() (Series和DataFrame通用)
.corr() (Series和DataFrame通用)
!!!完结撒花!!!
打算开下一个系列:
目前主要学习李沐的动手学深度学习,再搭配看一些统计学习方法的理论知识和吴恩达的机器学习课程