Python与机器学习之Numpy描述性统计(二)

Python与机器学习之相关性(实战一)

回顾上文(可戳)

今天我们来实战。

项目介绍

分析两只股票的相关性。(大家都懂真正解决问题很难很难…)

项目数据

ps:
- 收集数据也是一大难点,这里就不介绍了。
- 四根线分别表示开盘价,最高价,最低价,收盘价。
- 横坐标表示某月1-31号,纵坐标表示价格。

附录:股票A

这里写图片描述

股票B

这里写图片描述
如图明显感觉到两数据的相关性。(也正是我们鼓励的——先画数据)

相关性分析

import numpy as np
#假设股票A数据data_a,股票B数据data_b(最高价)
data=np.array((data_a,data_b)
#注意这里corrcoef生成的是相关矩阵
print(np.corrcoef(data)[0,1])
#Out:0.877------很显然得到结论

引申

遍历年份,统计分析09年到17年,会得到如下精彩的图:
这里写图片描述

总结

读者可能会疑惑,这个结论如何应用?
很显然,股票A和股票B具有很强的相关性。如果通过建立机器学习模型去预测股票A未来的趋势,股票B则是影响巨大的特征参数!(之后我们会继续讨论~)

描述性统计是容易操作,直观简洁的数据分析手段。
如果您看到这篇文章有收获或者有不同的意见,欢迎点赞或者评论。
python:190341254
丁。
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值