数据分析-强相关性数据,联合直观展示方法

假设 y1和y2两数据强相关,如何直观展现其数据情况?
要能展现其相关性、数值、趋势变化等

import matplotlib.pyplot as plt

x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
y1 = [2., 2.1, 2.5, 2.6, 2.4, np.nan, 2.6, 2.7, 2.8, 2.9]
y2 = [1., 1.1, 1.5, 1.6, 1.4, np.nan, 1.6, 1.7, 1.8, 1.9]
xx = np.arange(0,9,0.1)
plt.plot(x,y1,'-o',color='gray')
plt.plot(x,y2, '-*',color='y')

for i in x:
    plt.fill_between(x,y1=y1,y2=y2,where=(x>=i-0.5)&(x<=i+0.5),color='r',linewidth=10,alpha=0.4,step='mid')
# plt.show()

效果图如下:
在这里插入图片描述
适用范围:血压、商品售价与销售量等有较强关联的数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
相关性分析是数据特征分析中常用的一种分析方法,用于衡量两个变量之间的线性关系。通过相关性分析,可以确定变量之间的弱关系,帮助我们更好地理解数据并进行相关预测和决策。 常用的相关性分析方法有皮尔逊相关系数、斯皮尔曼等级相关系数和判定系数等。 皮尔逊相关系数是最常用的相关性分析方法之一,它衡量两个变量之间的线性关系度和方向。相关系数的取值范围为-1到1,其中-1表示完全负相关,0表示没有线性关系,1表示完全正相关。当相关系数的值接近于-1或1时,说明两个变量之间的关系比较;当相关系数的值接近于0时,说明两个变量之间的关系比较弱。 斯皮尔曼等级相关系数是一种非参数相关性分析方法,适用于数据不满足正态分布或数据类型为次序型的情况。它也衡量两个变量之间的关系度和方向,取值范围也为-1到1。 判定系数是一种用于衡量回归模型拟合程度的指标,它表示因变量的变异中有多少可以被自变量解释。判定系数的取值范围为0到1,值越接近于1,说明模型的拟合程度越好。 在进行相关性分析时,我们需要注意以下几点: 1. 相关性并不代表因果性。即使两个变量之间存在相关关系,也不一定意味着其中一个变量会影响另一个变量。 2. 相关性分析只能发现线性关系。如果变量之间存在非线性关系,相关性分析可能无法发现这种关系。 3. 相关性分析只能衡量两个变量之间的关系度和方向,不能确定两个变量之间的具体函数形式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值