python多特征分析_Python语言:Pandas数据特征分析

本文深入解析Python Pandas库的数据特征分析,包括sort_index()与sort_values()方法的应用,以及数据排序、基本统计、累计统计、相关性分析等内容。通过实例演示,帮助读者掌握Python数据处理技巧。
摘要由CSDN通过智能技术生成

本文主要向大家介绍了Python语言的Pandas数据特征分析,通过具体的实例让大家了解,希望对大家学习Python语言有所帮助。

Pandas数据特征分析

数据的排序

.sort_index()方法在指定轴上根据索引进行排序,默认升序。默认0轴升序:.sort_index(axis=0, ascending=True)。

.sort_values()方法在指定轴上根据数值进行排序,默认升序。

Series.sort_values(axis=0, ascending=True)

DataFrame.sort_values(by, axis=0, ascending=True)

by : axis轴上的某个索引或索引列表。

NaN统一放到排序末尾

数据的基本统计分析

数据的累计统计分析

数据的相关性分析

两个事物,表示为X和Y,如何判断它们之间的存在相关性?

相关性:

• X增大,Y增大,两个变量正相关

• X增大,Y减小,两个变量负相关

• X增大,Y无视,两个变量不相关

协方差:

•协方差>0, X和Y正相关

•协方差<0, X和Y负相关

•协方差=0, X和Y独立无关

Person相关系数:

R的取值范围为[-1, 1]

• 0.8‐1.0 极强相关

• 0.6‐0.8 强相关

• 0.4‐0.6 中等程度相关

• 0.2‐0.4 弱相关

• 0.0‐0.2 极弱相关或无相关

小结:

本文由职坐标整理并发布,希望对同学们学习Python有所帮助,更多内容请关注职坐标编程语言Python频道!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值