机器学习入门-5:大数据

来源:https://www.cnblogs.com/subconscious/p/4107357.html
无疑,在2010年以前,机器学习的应用在某些特定领域发挥了巨大的作用,如:车牌识别、网络攻击防范、手写字符识别等。
但是,从2010年以后,随着大数据概念的兴起,机器学习大量的应用都与大数据高度耦合,几乎可以认为大数据是机器学习应用的最佳场景。
譬如,但凡你能找到的介绍大数据的文章,都会说大数据如何准确预测到了某些事。例如Google利用大数据预测了H1N1在美国某小镇的爆发。
这里写图片描述
百度预测2014年世界杯,从淘汰赛到决赛全部预测正确。
这里写图片描述
大数据的核心是利用数据的价值,机器学习是利用数据价值的关键技术,对于大数据而言,机器学习是不可或缺的。相反,对于机器学习而言,越来越多的数据会越可能提升模型的精确性,同时,复杂的机器学习算法的计算时间也迫切需要分布式计算与内存计算这样的关键技术。因此,机器学习的兴盛也离不开大数据的帮助。

必须清醒地认识到,大数据并不等同于机器学习,同理,机器学习也不等同于大数据。大数据中包含有分布式计算、内存数据库、多维分析等等多种技术。
单从分析方法来看,大数据可分为四种:
1. 大数据,小分析:数据仓库领域的OLAP分析,即多维分析思想
2. 大数据,大分析:数据挖掘与机器分析
3. 流式分析:事件驱动框架
4. 查询分析:典型代表是NoSQL数据库
机器学习仅仅是大数据分析中的一种。机器学习与大数据的结合产生了巨大的价值。基于机器学习技术的发展,数据能够“预测”。机器学习界的名言“成功的机器学习应用不是拥有最好的算法,而是拥有最多的数据”。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值