这篇笔记是对mooc所讲的pandas库的个人整理,资料来源于 中国大学mooc 北京理工大学开设的python数据可视化教程
排序
.sort_index()方法在指定轴上根据索引进行排序,默认升序
1.竖轴
默认升序
降序排列
2.横轴
.sort_values()方法在指定轴上根据数值进行排序,默认升序
.sort_values(by,axis=0,ascending=True),该方法根据数值排序,与.sort_index()相似但是多了一个参数by,by表示的是axis轴上的某个索引或索引列表。
统计
基本统计分析
累计统计分析
这些函数操作起来都挺简单,但是要注意每种函数使用的pandas数据类型,博主就曾将DataFrame类型用.argmin()函数操作(肯定会报错的)
相关性分析
mooc上的资料已经很完整了,我就不多加赘述了
相关性
协方差
由于协方差来计算相关性不太准确,所以人们探索研究出了许多更准确的相关系数,例如Pearson相关系数
spearman相关系数
相关系数函数
两个星期mooc的课程终于听完了😂(感觉自己好慢啊),下一篇就开始是tensorflow的笔记了跟大家分享一个教材简单粗暴tensorflow2