机器学习
Primal
良好的成功是开端的一半
展开
-
用sklearn分析基金数据 <1>
最开始接触大数据时会产生大数据包含机器学习、机器学习为大数据服务的错觉,无形中使大数据更加高大上了,然而机器学习的应用比如数据挖掘、文本挖掘、图像处理等并不依赖于大数据,大家彼此相互独立。 大数据技术比如hadoop生态只是一套解决方案,区别于传统方案主要体现在分布存储的扩展性和计算能力的分发性。而数据挖掘更加源远流长与大数据更是没有必然关系,大数据上进行数据挖掘受限于算法时效性可...原创 2018-07-22 16:17:35 · 2146 阅读 · 0 评论 -
python爬虫获取基金数据<2>
用sklearn分析基金数据<1>python爬虫获取基金数据<2>数据预处理:数据清洗、生成样本数据<3>用sklearn训练样本数据<4>用模型进行预测及改进<5> 前面已经说了大致思路,需要用上个月所有基金的表现情况来预测这个月所有基金的表现情况,数据的获取显然是第一步,像基金这种开放的数据通过python爬虫来得到自然...原创 2018-07-22 16:17:47 · 4743 阅读 · 1 评论 -
数据预处理:数据清洗、生成样本数据<3>
用sklearn分析基金数据<1>python爬虫获取基金数据<2>数据预处理:数据清洗、生成样本数据<3>用sklearn训练样本数据<4>用模型进行预测及改进<5> 得到数据相当于原材料,在进行训练前还需要对数据进行预处理,保证数据质量,处理异常值等,减少最终结果误差,由于我们得到的数据比较单一,数据质量问题不大,但也有需要...原创 2018-07-22 16:17:52 · 3158 阅读 · 1 评论 -
用模型进行预测及改进<5>
用sklearn分析基金数据<1>python爬虫获取基金数据<2>数据预处理:数据清洗、生成样本数据<3>用sklearn训练样本数据<4>用模型进行预测及改进<5>前面是把12月数据按80%和20%分成训练集和测试集,测试结果还不错,现在来做实际应用,以11月数据做为训练集,12用数据作为测试集。具体代码如下:import p...原创 2018-07-22 16:18:01 · 1218 阅读 · 0 评论 -
用sklearn训练样本数据<4>
用sklearn分析基金数据<1>python爬虫获取基金数据<2>数据预处理:数据清洗、生成样本数据<3>用sklearn训练样本数据<4>用模型进行预测及改进<5>拿到样本数据后就可以用sklearn中的各个分类算法来做训练了,由于样本是很简单的二分类问题,特征变量也很少,像多元分类、降维这类问题都不用考虑了,我也想过拿回归算法来...原创 2018-07-22 16:17:56 · 2612 阅读 · 0 评论