阅读原文:http://club.jr.jd.com/quant/topic/841642
京东金融官方资讯QQ群:417082141 有什么想咨询的都可以来询问我们哦
如今,大数据(Big Data)和数据挖掘(Data Mining)成为了一个热门话题和学术研究课题,但很多人对于它们的定义却只停留在数据量庞大而造成计算困难的层面。实际上,大数据往往代表的是大量的、不完全的、有噪声的、模糊的数据,而数据挖掘是指从大数据中提取隐含的、事先不知道的、但又是潜在有用的信息和知识的过程。
决策树算法作为数据挖掘其中一种判定数据所属类别的算法,数学模型简单,编程有程序包,极易上手,适合大家研究使用。具体应用常常是针对股票的高频数据算出VWAP后对股票涨跌进行预测,VWAP数据我注意到京东平台提供了,用get_vwap(intervals, frequency='day')语句在策略里就可以。需要前期的训练数据集进行学习。通常使用Python中的Scikit-learn学习包(简称sk-learn),下载地址:scikit-learn: machine learning in Python.