Python与机器学习之相关性(实战一)
回顾上文(可戳)
今天我们来实战。
项目介绍
分析两只股票的相关性。(大家都懂真正解决问题很难很难…)
项目数据
ps:
- 收集数据也是一大难点,这里就不介绍了。
- 四根线分别表示开盘价,最高价,最低价,收盘价。
- 横坐标表示某月1-31号,纵坐标表示价格。
附录:股票A
股票B
如图明显感觉到两数据的相关性。(也正是我们鼓励的——先画数据)
相关性分析
import numpy as np
#假设股票A数据data_a,股票B数据data_b(最高价)
data=np.array((data_a,data_b)
#注意这里corrcoef生成的是相关矩阵
print(np.corrcoef(data)[0,1])
#Out:0.877------很显然得到结论
引申
遍历年份,统计分析09年到17年,会得到如下精彩的图:
总结
读者可能会疑惑,这个结论如何应用?
很显然,股票A和股票B具有很强的相关性。如果通过建立机器学习模型去预测股票A未来的趋势,股票B则是影响巨大的特征参数!(之后我们会继续讨论~)
描述性统计是容易操作,直观简洁的数据分析手段。
如果您看到这篇文章有收获或者有不同的意见,欢迎点赞或者评论。
python群:190341254
丁。