最开始接触大数据时会产生大数据包含机器学习、机器学习为大数据服务的错觉,无形中使大数据更加高大上了,然而机器学习的应用比如数据挖掘、文本挖掘、图像处理等并不依赖于大数据,大家彼此相互独立。
大数据技术比如hadoop生态只是一套解决方案,区别于传统方案主要体现在分布存储的扩展性和计算能力的分发性。而数据挖掘更加源远流长与大数据更是没有必然关系,大数据上进行数据挖掘受限于算法时效性可能还要采样成小数据吧。但正由于算法时效性更加需要大数据的分布计算能力和大规模样本数据的存储,所以工业生产两者也就有机的结合了吧。
作为一名业余人员用python的sklearn来学习还是很不错的,可以做些小实验,甚至是原型开发。我在学习机器学习和sklearn之后想到还是应该做点东西练下手。就想到用机器学习的某些算法来分析基金数据。
项目简介:股票市场应该是一种混沌市场充满随机性和不确定性,影响因素太多,各种技术指标都不能确切解释,高频发交易更是增加难度。现实中很多人选择买基金,稳健更省心。直觉上基金市场通过基金经理的操作使混沌性要小一些,那是否可以用机器学习分析基金数据,为购买基金提供参考呢?
我将做一个初步的探索。投资基金一般会长期持有以获得预期收益区别于股票的短线操作。我以一个月为周期,以上个月所有基金的表现情况来预测这个月所有基金的表现情况,选择表现最好的若干支基金持有一个月计算收益,评估方案。
具体步骤如下:
用sklearn分析基金数据<1>
python爬虫获取基金数据<2>
数据预处理:数据清洗、生成样本数据<3>
用sklearn训练样本数据<4>
用模型进行预测及改进<5>
用sklearn分析基金数据 <1>
最新推荐文章于 2024-04-28 14:27:04 发布