[译] 实时股票预测的开源参考结构

[译] 实时股票预测的开源参考结构

大数据文摘 2016-01-06 08:20

关于转载授授权

大数据文摘作品,欢迎个人转发朋友圈,自媒体、媒体、机构转载务必申请授权,后台留言“机构名称+文章标题+转载”,申请过授权的不必再次申请,只要按约定转载即可,但文末需放置大数据文摘二维码。

作者:WilliamMarkito

翻译:姜咏耀, Helen

审校:Rebecca,Shawn

素材来源:https://blog.pivotal.io/big-data-pivotal/case-studies/an-open-source-reference-architecture-for-real-time-stock-prediction

[译] 实时股票预测的开源参考结构

有这样一个传说,将人工智能和机器学习算法用于服务器农场后,你就可以搬家到夏威夷,在让机器交易的同时你终日躺在沙滩上享受生活。但是,问题在于交易市场是不断变化的:经济力量,新产品,竞争,世界事件,法规,甚至推特都是因素。虽然没有免费的午餐,在开放源码机器学习算法和数据分析平台的帮助下,公司仍然可以得到一个“更好,更健康,更便宜的午餐”。在股票市场中,查看历史股票价格并尝试用不同的模型来预测未来是一种常见的做法。

虽然这篇文章不能提供股票分析的细节,但它提出了一种用于解决大规模实时数据分析问题的方法,在一个可高度扩展和延伸性的参考架构下使用开放源代码工具。下面的架构专注于金融交易,但也适用于几乎任何一个行业的实时使用需求。关于这篇文章所讨论的构架的更多信息也可在网上通过Linux基金会,SlideShare,YouTube,和Pivotal Open Source Hub阅读,同时这个架构的组件也可以通过这些网站下载。

架构:股票预测与机器学习

概括而言,股票预测和机器学习的架构(如下图所示)支持一个由预测模型推动的优化过程,并有三个基本组成部分。首先是输入,实时交易数据必须被捕获和存储,变为历史数据。其次,系统必须能够从数据的历史趋势中学习,并通过识别规律和概率来做出决定。第三,系统需要把新的交易数据与历史数据的规律和概率进行实时对比。然后预测出结果并决定采取何种行动。

[译] 实时股票预测的开源参考结构

上图是简化版,该类型的结构在系统范围增加的情况下还有几个基本因素要考虑。其中重要的是,数据量和系统集成。许多不同来源和类型的数据被用来预测结果,以及各种各样的汇数据处理。在一个20个数据源和20个处理汇的环境里,实时功能仍需要非常低延迟的操作。这体现了扩展问题的两个面。首先,数据处理应用程序要解决横向扩展就需要增加更多的节点,并保持非常快速的实时响应。其次,久而久之系统会存储更多的数据。除了历史数据集的增加,不同的分析工作也要同时运行来提高模型的预测性。

在系统架构中使用开源组件

如果把每一个高层次组件扩展到更具体的细节,开源产品可以运用到整个架构的各个功能部分。这些包括SpringXD (现在叫Spring Cloud Data Flow),Geode (孵化中),Spark MLlib, ApacheHAWQ,和Apache Hadoop™。

[译] 实时股票预测的开源参考结构

数据流和数据通道大致可以分为六个步骤,如上图所示,具体的讲解会在下面展示。更重要的是,每个组件都具备松散耦合和横向扩展性的特征。

SpingXD读取和处理来自雅虎金融网络服务器集群的API提供的实时数据。SpringXD极大简化了数据流的业务流程,并为系统集成提供内置连接器,SpringXD是基于Java语言的产品,可以处理各种转换。数据通过SpringXD后,被储存到一个具有快速,稳定,灵活,和线性扩展的系统内存里面,这个系统叫Apache Geode(孵化中),系统还可以提供事件的数据分发处理。

通过使用Apache Geode提供的新鲜数据,Spark MLib的应用程序建立和训练一个用于对比新数据与历史数据之间规律的模型。其它工具也同样支持这些模型,例如ApacheMADlib 或者 R。

机器学习模型得到的结果会被推送到其它应用进行处理,同时结果会在Apache Geode上更新,并进行实时预测和决策。

随着数据越来越多,旧的数据从最初的Apache Geode 被转移到Apache HAWQ, 最后被储存在Apache Hadoop中。ApacheHAWQ 支持基于拍字节的SQL查询,同时也允许数据科学家迭代并优化他们的模型。

另外一个处理程序被触发了,使用已收集的历史数据去有规律地重复训练和更新机器学习模型。在这程序里面,当历史数据发生改变或是有新的模型出现时,它会关闭数据循环,创建持续更新,并进行优化。

一个可在笔记本电脑上运行的简化架构

为了能让系统在一个普通笔记本电脑上运行,其架构需要被简化。Linux Foundation 在匈牙利的布达佩斯举行的Apache Big Data 2015 展会上展示了这一方法。简单来讲,这个方法是把长期数据存储组件从Apache HAWQ 和 Apache Hadoop 上移除。

[译] 实时股票预测的开源参考结构

在这个解决方案中,每个组件的功能都有一个具体定义并且会根据需求在本地扩展或者在云端拓展。为了达到方便调度,维护和支持的目的,开源组件可以与Pivotal Clould Foundry 进行连接用于处理程序运行,PivotalGemFire 取代了Apache Geode 或者PivotalBig Data Suite 里的其它组件,用于处理大型的历史数据集。

GitHub支持这一架构,另外一个例子是JavaFX。雅虎金融的新数据被SpringXD采集后推送到Apache Geode的服务器上,然后Apache Geode把这些数据推送到JavaFX,JavaFX把这些实时数据更新并将这些数据以可视化形式呈现给用户。另外还有一个叫股票信息模拟器的应用,它能够在由于没有网络连接而无法收集信息的情况下使用,或者是为了二次开发而使用。

[译] 实时股票预测的开源参考结构

根据上图所示,数据正在被实时收集然后生成相应的指数,比如最后收盘价,平均指数和预测平均指数。

更多相关学习

这个系统的源码和安装教程可以在Pivotal Open Source Hub上找到。下载的文件中也包括一个Vagrant box的虚拟环境,当中包含了所有需要的组件。

从Linux Foundation, Slideshare, or YouTube获得更多的信息

访问与Apache Geode website, Pivotal GemFire website相关话题的文章

查看Apache Geode website, Pivotal GemFire website网站

阅读Apache MADlib详情

Editor’s Note: ©2015 Pivotal Software, Inc. All rights reserved.Pivotal, Pivotal Greenplum, Pivotal GemFire and Pivotal Cloud Foundry aretrademarks and/or registered trademarks of Pivotal Software, Inc. in the UnitedStates and/or other countries. Apache, Apache Hadoop, Hadoop, Apache Geode,Apache MADlib, Apache HAWQ, and ApacheSpark are either registered trademarks or trademarks of the Apache SoftwareFoundation in the United States and/or other countries.

编者注记:相关版权©2015 Pivotal Software, Inc. All rights reserved.Pivotal, Pivotal Greenplum, Pivotal GemFire and Pivotal Cloud Foundry aretrademarks and/or registered trademarks of Pivotal Software, Inc. in the UnitedStates and/or other countries. Apache, Apache Hadoop, Hadoop, Apache Geode,Apache MADlib, Apache HAWQ, and ApacheSpark are either registered trademarks or trademarks of the Apache SoftwareFoundation in the United States and/or other countries.

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
FreeStock股票分析软件(V1.0)   FreeStock 股票分析软件展示了一般股票分析软件的核心技术,全部代码采用VC6.0编写,没有使用任何第三方控件,程序执行速度快。V1.0基本完成了静态分析部分的决大部分功能,在这个基础上进行盘中、选股等功能的扩充是相当容易的。 如果在使用过程中程序出现BUG,请告诉我:cymwork@sina.com; 或者对本软件有什么意见或建议,也请告诉我:cymwork@sina.com,以便程序功能更强大,更加方便普通用户的使用。 特色功能: 1、良好的程序结构,便于扩充:所有的图形元素都封装在类中,使用及扩充很容易; 2、高效快速的文件系统:这在股票分析软件中至关重要的,数据文件采用B+树索引,单个数据文件可存储2G的资料; 3、超强的表格系统:表格在任何任何软件中都很重要,这个表格呢? 以下是已经基本完成的功能简介: 行情表:显示实时盘中数据,也是与用户进行交互的接口; 画线工具:提供如下的画线功能: 名称 功能简述 直线 在图形中移动两点画直线,以测量趋势。 圆 在图形中移动两点画园,分析周期和转折点的规律。 正弦曲线 在图形中移动两点画正弦曲线,分析周期和转折点的规律。 矩形曲线 在图形中移动两点画矩形曲线,分析周期和转折点的规律。 菲氏正弦波 在图形中移动两点画菲氏正弦波,分析周期和转折点的规律,并可智能化计算出未来股价的三个重要转折日期。 菲氏矩形波 在图形中移动两点画菲氏矩形波,分析周期和转折点的规律。 椭圆 在图形中移动两点画椭园,分析周期和转折点的规律。 角度线 在图形中移动两点或输入角度值,分析波段趋势规律。 上升甘氏 在图形中分析上升波段趋势规律和对下降波段的支撑作用。 下降甘氏 在图形中分析下降波段趋势规律和对上升波段的支撑作用。 菲波那奇数列 在图形中移动两点画出菲波那奇数列,分析周期和转折点的规律。 黄金分割线 在图形中移动两点画出横向和纵向黄金分割线,分析周期和转折点的规律。 百分比线 在图形中移动两点画出横向百分比线,分析周期和转折点的规律。 黑洞阻挡线 在图形中移动两点画出起点黑洞阻挡线,分析中期阻挡规律。 密集成交带 选择股价波段,可显示该波段的密集成交带。 gan指标 是智能化研究股价波段的多价位阻挡工具。 十字光标:很方便的查看图形数据; 键盘宝:与用户交互的接口,支持公式的输入; 区域统计:方便的数据统计; 筹码分布图:几乎所有股票分析软件都有的; 日线报表:查看个股的历史数据; 多股同列:可以实现2、4、9股同列,由于时间的关系,V1.0没有做选择的界面,所以只有4股同列; 分析周期:可以很方便地在日线、周线、月线、5分钟、15分钟、30分钟、60分钟及盘中走势间切换; 画面组合:盘中可以最多3图组合;盘后最多可以4图组合; 指标内容:V1.0只完成了K线、成交量及MACD三个指标; 除复权:Ctrl+J,Ctrl+H热健 图形操作:放大、缩小;左移、右移;左翻页、右翻页; 数据导入:V1.0完成了乾隆格式的历史数据导入,速度极快; 界面设置:V1.0内置两套方案,由于时间的关系,没有做选择的界面,在SPLASH中见到的是另外一套方案。 说明: 1、打包文件中附带的历史数据有: 1A0001,1A0002,1A0003,600601,600602,600603 0001,0002,0003,2A01,2A02,2A03,2B01. 2、目前深证的代码只支持4位。 如果在使用过程中程序出现BUG,请告诉我:cymwork@sina.com; 或者对本软件有什么意见或建议,也请告诉我:cymwork@sina.com,以便程序功能更强大,更加方便普通用户的使用。 cymwork 于2002年03月13日 .

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值