股市大数据分析
从去年11月以来,中国A股已经进入牛市阶段。那么怎么在股市里更好的盈利呢?一些简单的规律其实可以是很帮助的。比如每天A股上证指数变化趋势一般都是符合“持续上涨”、“持续下跌”、“平盘后迅速拉起”、“平盘后迅速下跌”、“深V字型”等几种模式的。我考虑能不能利用数据挖掘里的聚类技术–均值聚类和凝聚层次聚类来分析每天的上证指数变化情况,看看每日的变化趋势到底符合哪些模式。
我们采用2014年11月28日到2015年6月26日,一共141天的上证综合指数的15分钟K线数据作为原始数据。首先我们利用每个15分钟的开盘价和收盘价的均值来估计一个15分钟平均价。这样每天交易的4个小时的数据就对应了16个平均价。
为了反应上证指数的变化趋势,我们计算每15分钟均价对应前15分钟均价的变化幅度,假设第 i 个平均价为