本文主要向大家介绍了Python语言的Pandas数据特征分析,通过具体的实例让大家了解,希望对大家学习Python语言有所帮助。
Pandas数据特征分析
数据的排序
.sort_index()方法在指定轴上根据索引进行排序,默认升序。默认0轴升序:.sort_index(axis=0, ascending=True)。
.sort_values()方法在指定轴上根据数值进行排序,默认升序。
Series.sort_values(axis=0, ascending=True)
DataFrame.sort_values(by, axis=0, ascending=True)
by : axis轴上的某个索引或索引列表。
NaN统一放到排序末尾
数据的基本统计分析
数据的累计统计分析
数据的相关性分析
两个事物,表示为X和Y,如何判断它们之间的存在相关性?
相关性:
• X增大,Y增大,两个变量正相关
• X增大,Y减小,两个变量负相关
• X增大,Y无视,两个变量不相关
协方差:
•协方差>0, X和Y正相关
•协方差<0, X和Y负相关
•协方差=0, X和Y独立无关
Person相关系数:
R的取值范围为[-1, 1]
• 0.8‐1.0 极强相关
• 0.6‐0.8 强相关
• 0.4‐0.6 中等程度相关
• 0.2‐0.4 弱相关
• 0.0‐0.2 极弱相关或无相关
小结:
本文由职坐标整理并发布,希望对同学们学习Python有所帮助,更多内容请关注职坐标编程语言Python频道!