机器学习
文章平均质量分 89
love others as self
love others as self! ----愿美梦成真!
展开
-
机器学习
在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是 EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常长的文章呢?我并不直转载 2016-04-08 16:29:11 · 914 阅读 · 0 评论 -
如何成为一名数据科学家?
如何成为一名数据科学家? 谢科,数据科学,机器学习,康奈尔大学PhD研究生"Data Science = statistics who uses python and lives in San Francisco"恰好我马上启程到 Twitter 的 data science team,而且恰巧懂一点点统计和住在旧金山,所以冲动地没有邀请就厚脸回答了:D我认为有几个大方转载 2016-04-15 13:26:57 · 378 阅读 · 0 评论 -
MLlib数据类型
1.本地向量 本地向量的基类是 Vector,我们提供了两个实现 DenseVector 和 SparseVector。我们建议通过 Vectors中实现的工厂方法来创建本地向量:(注意:Scala语言默认引入的是 scala.collection.immutable.Vector,为了使用MLlib的Vector,你必须显示引入org.apache.spark.mllib.li转载 2016-06-03 22:22:16 · 1191 阅读 · 0 评论 -
为什么需要机器学习
1:涉及的数据规模意味着完全依靠人工处理会跟不上2: 机器学习和统计模型等基于模型的方式能发现人类(因数据集量级和复杂的过高)难以发现的模式3: 基于模型的方式能避免个人或是情感上的偏见原创 2016-06-19 10:58:28 · 627 阅读 · 0 评论 -
xgboost: 速度快效果好的boosting模型
转自:http://cos.name/2015/03/xgboost/2015/03/04数据挖掘与机器学习、统计之都、统计软件、软件应用boosting、Gradient Boosting Machine、xgboost、数据建模预测严酷的魔王本文作者:何通,SupStat Inc(总部在纽约,中国分部为北京数博思达信息科技有限公司)数据科学家,加拿大Simon Fr转载 2016-08-10 16:45:41 · 2979 阅读 · 1 评论 -
回归学习
http://blog.csdn.net/omenglishuixiang1234/article/details/50247143示例:预测1 收集数据:给定数据文件2 准备数据:解析文本并填充缺失值3 分析数据:可视化并观察数据4 训练数据:使用优化算法,找到最佳的系数5 测试算法:为了量化回归的效果,需要观察错误率,根据错误率决定是否回退到训练阶段,通过改变迭原创 2017-07-13 11:43:39 · 725 阅读 · 0 评论