#Python数据分析-数据探索下

0?wx_fmt=png

主题  |  数据探索

接着上一节的内容~

二、数据特征分析

5. 相关性分析

(1)直接描述散点图

从散点图可以比较直观地看书两个变量的相关性。(一般分为完全正线性相关、完全负线性相关、非线性相关、正线性相关、负线性相关、不相关)

(2)绘制散点图矩阵

可对多个变量同时进行相关关系的考察

(3)计算相关系数

这里的相关系数有很多,如Pearson相关系数、spearman相关系数、判定系数等等

三、python主要数据探索函数

python中用于数据探索的库主要是pandas和matplotlib,而pandas提供大量的函数,也作为重点来进行介绍

1. 基本统计特征函数(均属pandas)

(1)sum(),计算数据样本的总和(按列计算)

(2)mean(),计算算数平均数

(3)var(),计算方差

(4)std(),计算标准差

(5)corr(),计算Pearson相关系数

(6)cov(),计算协方差矩阵

(7)skew(),计算偏度

(8)kurt(),计算峰度

(9)describe(),给出样本的基本描述

2. 统计作图函数

(1)plot(),绘制线性二维图,matplotlib/pandas

使用格式:plt.plot(x,y,S)

字符串S指定绘制图形的类型、样式和颜色,常用的有:‘b’为蓝色、‘r’为红色、‘g’为绿色、‘o’为圆圈、‘+’为加号标记、‘-’为实线、‘--’为虚线

0?wx_fmt=png

(2)pie(),绘制饼形图,matplotlib/pandas

0?wx_fmt=png

(3)hist(),绘制二维条形直方图,matplotlib/pandas

0?wx_fmt=png

(4)boxplot(),绘制样本数据的箱形图,pandas

0?wx_fmt=png

(5)plot(logy=true),绘制y轴的对数图形,pandas

0?wx_fmt=png

0?wx_fmt=png

(6)plot(yerr=error),绘制误差条形图,pandas

0?wx_fmt=png

—End—

欢迎关注,嘻嘻~

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值