机器学习(machine learning)随着大数据的火热后也渐渐进入了大众的视野,但是大多数没有仔细了解过机器学习的朋友都对机器学习有认识上的偏差,比如说有一次和朋友聊天,朋友认为机器学习就是给智能机器人写算法。虽说机器学习的主要算法和应用的确在智能机器人上有很多体现但是这样的认识还是有些狭义。机器学习,其实是利用计算机来对数据进行像人类本能一样的学习而获取数据中人们很难发现的真实含义的数据处理方法的集合。和人类使用天生的学习能力来学习如何日常生活一样,使用机器学习方法让计算机学习数据的过程中,计算机通常不需要了解数据中最精确的量化关系就能获取数据中高准确率的结论或规律。
机器学习的潜在价值
机器学习是对人类认知水平的一个补充,人类无法短时处理大量原始数据,或者当处理特定数据所消耗的时间价值超过了处理这些数据产生的价值。比如判断垃圾邮件,虽然对于每个人来说垃圾邮件也许总量并不多,但是处理垃圾邮件所花费的几分钟时间产生的价值甚至还没有呆坐着产生的效用高。所以运用计算机将邮件这样内容不具有特定格式的数据进行处理分析得出邮件的属性就尤为重要,也就是说机器学习把无序的信息转化为有序的信息。
机器学习在几乎所有工程学科中都可以进行运用,也需要特定学科的知识,可以说机器学习对于任何需要解释并操作数据的领域都有所效用。
有时候我们可以运用上天赐予我们的大脑和已有的知识储备以及算法清楚的理解一个问题,比如说自动售货机的工作原理,但是对于另一类问题,由于信息量过大,或者问题涉及影响因素过多而无法对问题建立精确的模型,比如预测人的行为。这时就不得不运用统计学工具了。
现今,互联网上的数据很多都是人工产生的,但是越来越多的非人为数据正随着物联网的发展在以越来越快的速度占领世界各地服务器的存储空间,这类数据的采集者也可以称作传感器。对于这类数据,