机器学习
文章平均质量分 77
Awin_Ge
这个作者很懒,什么都没留下…
展开
-
机器学习中数据缺失值处理方法
数据值缺失是数据分析中经常遇到的问题之一。当缺失比例很小时,可直接对缺失记录进行舍弃或进行手工处理。但在实际数据中,往往缺失数据占有相当的比重。这时如果手工处理非常低效,如果舍弃缺失记录,则会丢失大量信息,使不完全观测数据与完全观测数据间产生系统差异,对这样的数据进行分析,很可能会得出错误的结论。造成数据缺失的原因缺失值处理的方法使用可用特征的均值来填补缺失值使用特殊值来填补缺...原创 2018-06-17 22:48:00 · 11230 阅读 · 1 评论 -
机器学习的一般性步骤------以互联网的下单率预测为例
本文主要讲述机器学习在实际应用中的一般性步骤,包括基本技术、经验和技巧。 下面先给出一张机器学习整体的概览图: 从上图可以看出,有两个流程:离线训练流程(蓝色箭头),包含数据筛选和清洗、特征抽取、模型训练和优化模型等环节;应用流程(绿色箭头),对需 要预估的数据,抽取特征,应用离线训练得到的模型进行预估,获得预估值作用在实际产品中通过以上可以得出机器学习应用的整个步骤如下:...原创 2018-06-18 09:44:35 · 1410 阅读 · 0 评论 -
Python读取股票数据并可视化
本文主要是使用Python读取股票数据,以便获得时间序列数据,方便后续的时间序列分析获取数据由于传统的yahoo网站上的股票数据有防火墙隔离,常用的API接口已不能使用,本文推荐一个tushare库,可以获取国内外的股票数据,关于tushare的详细了解可参考 https://blog.csdn.net/zyaiwmy/article/details/70241624。impo...原创 2018-07-14 18:14:49 · 13164 阅读 · 2 评论