el-select 多选取值_股票选取-记“国元证券杯”比赛

介绍

本次将介绍我们团队在省级比赛国元证券杯比赛获得一等奖的思路介绍,因当时收集的数据源已经丢失,所以只是重新整理下思路,方便之后面试或者工作中运用。首先从如何便捷地获取股票历史数据,并实现快速绘图。同时,尝试计算买入和卖出过程中的收益,并标记出涨跌转折点。最后,使用机器学习方法对数据进行建模,并给出股票未来走势的预测结果。

步骤

  • 数据采集方法
  • 数据字段理解
  • 数据清洗和预处理
  • 绘制饼图
  • 绘制相对变化曲线
  • 短期交易策略
  • 股票长期趋势预测

一、数据来源和所需字段的理解

一般是从两个方面去获取数据,一是从要选取的公司或企业的官网去获取、统计年鉴平台能够得到这些公司提供给我们的一些数据;另一种方法是通过我们自己去获得的,可以在一些公开的数据源上获得,比较权威的就是Yahoo做的API(雅虎财经网站)Yahoo Finance - Business Finance, Stock Market, Quotes, News,通过这个API几乎可以获取所有公司的历史股票信息。国内比较著名的交易所是上海证券交易所和深圳证券交易所。以及另外一些觉得可能有用的数据,都可以通过各种渠道去直接获得或者经过简单的逻辑推理出来。

一般所需的数据字段有:成交日期、开盘价格、最高价格、最低价格、收盘价格(Close)、调整后收盘价格、成交量,由此也可以推算出涨幅等等数据。只有理解数据,才能对股票做出分析,不然只是空谈或者是做伪分析。

二、数据清洗

拿到数据之后,有些数据可能并不完整或者并不准确,这时我们需要先对数据做一个预处理过程。

一般可分为文本类数据和数值类数据,一般的文本类数据是可以直接拿来用的,比如要判断一只股票的“潜力”,可以从目前的经济环境来看,目前的经济发展的环境良好,那么对市场也是起到促进作用,自然能够对股票的涨跌起到作用,金融风暴来临时,股市肯定是不景气的;另一方面也可以对行业的发展来看,比如近几年的物流行业发展较为迅猛,对一些和物流有关公司的发展也是起着好的作用。这样可以缩小我们的选股范围。

对于另一类数值类型的数据,这类数据是可以量化的,分类型的数据可以拿来直接判断数据的“好坏”,而连续型的数据随着时间发展来看也会有一定的发展趋势,假设近几年的外部环境近似的话,也可以通过对历史股票数据的走向来预测未来近一段时间内的股票的可能走向等等。

主要是做了以下几种清洗方式

第一是对错误值和异常值的处理,在收集数据的过程中,可能会出现一些明显是异常的值,首先的话还是先判断这些异常出现的原因,假如是人为粗心导致的,那么可以直接修改,假如是数据源本身的错误,那么可以进行一些均值,中位数的替换等方法进行。有时候并不是能收集到所有需要的数据,有的数据集中也可能会出现缺失值的情况,这些都需要根据不同的情况去处理。

第二是可能会有一些值的预处理,比如一段时间内股票价格的增高或者降低,可以转化成率来进行分析。同时也达到降维的目的,减少不必要的工作量。可以对其他字段和股票价格的涨跌字段做主成分分析,以此提取所占比例达到一定阈值的字段即可,或者是通过求他们之间的相关性,选择相关性大于某个阈值的。

当然还有一些其他的数据预处理方法。比如一些数据的归类、聚类、离散化和数据的抽样(可能不是所有得到的数据都会用上)。。。

三、应用的方法

可视化的方法是最直观的,单日或者单周的股价涨跌变化情况可以通过饼图来看,还可以通过绘制相对变化曲线来看单个股票在一段时间内的变化趋势。可以把一段时间内的涨跌比例情况绘制成饼图,然后比较哪种的比例较高,得出结论。

绘制相对变化曲线。

饼图可以用于反映当天的股价变化情况,如果想要看到当天和前一天的相对变化(涨或跌),就需要通过计算后再进行绘图了。可以通过曲线图的变化趋势进行短期的决策。

最后可以选取对股票价格涨跌影响因素最大的字段,做出预测

用到的建模思想有:分类方法有决策树相关的思想,对于每一个判断节点,都可以产生一种类似于分类器的模型去判断价格的涨跌,另外还采取了加权的方法去提升他的准确度,最近邻方法,用与选股阶段,想要快速知道一个新朋友是一个怎么样的人,可以通过看他的朋友大部分是什么性格的人。预测的方法,线性回归预测非线性回归预测,这种思想用的最多,逻辑回归预测,判断股票是牛股还是熊股。

另外长期的预测中可能预测到价格,但是并不能准确预测到达该价格的时间。股价一定程度依赖于信息,但你基本不可能知道明天的信息。市场交易往往是投机行为,并不理性。因此股票有风险,入市需谨慎啊!

附:还是觉得思路比较乱,还需要再多总结,思路才能更加清晰。另外在学习数据分析的相关方法后,很多地方的细节需要注意,方法也需要优化才可以。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值