统计学,数据挖掘,机器学习和人工智能之间的区别及联系

统计学,数据挖掘,机器学习和人工智能之间的区别及联系

首先,让我们来对这些学科进行大致的了解

①:统计学

统计学是在资料分析的基础上,自17世纪中叶产生并逐步发展起来的一门学科,它是研究如何测定、收集、整理、归纳和分析反应数据资料,一边给出正确信息的科学。统计学广泛的应用在各门科学,从自然科学、社会科学到人文科学,甚至被用来做工商业和政府的情报决策。随着大数据时代的来临,统计的面貌也逐步被改变,与信息、计算机等领域密切结合,是数据科学(Data Science)中的重要主轴之一。

②:数据挖掘

在当今大数据时代,企业有大量可用的数据,数量巨大,其价值和知识是不可估量的。如何从这些海量混乱的数据中获取有价值的信息,帮助企业更好地发展,是许多企业迫切需要解决的问题之一。

数据挖掘是指通过算法从大量数据中搜索隐藏在其中的信息的过程,通过数据挖掘我们可以从海量错综复杂,看似毫无关联的数据中提取出有用的信息,发挥出信息的价值;在我看来,数据挖掘更像是大数据处理的一个基础,为我们数据的处理并提取有用的信息打下了坚实的基础。

此外,传统的数据挖掘一般只能支持单机小规模数据处理。由于这种限制,传统的数据分析挖掘一般采用抽样方法来减少数据分析的规模,这也导致分析结果不准确。将计算机技术运用于数据挖掘之中,我们可以进行数据的可视化分析,数据挖掘算法,预测性分析,语义引擎及数据质量及数据管理。以上技术的发展提高了分析结果的准确性。

③:机器学习

机器学习被认为是人工智能的一方面:给定一些可用离散术语(例如,在一些行为中,那个行为是正确的)描述的人工智能问题,并给出关于这个世界的大量信息,在没有程序员进行编程的情况下弄清楚「正确」的行为。典型的是,需要一些外部流程判断行为是否正确。在数学术语中,也就是函数:馈入输入,产生正确的输出。所以整个问题就是以自动化的方式建立该数学函数的模型。在二者进行区分时:如果我写出的程序聪明到表现出人类行为,它就是人工智能。但如果它的参数不是自动从数据进行学习,它就不是机器学习。

④:人工智能

人工智能是计算机科学的一个子领域,创造于 20 世纪 60 年代,它涉及到解决对人类而言简单却对计算机很难的任务。详细来说,所谓的强人工智能系统应该是能做人类所能做的任何事。而深度学习是如今非常流行的一种机器学习。

而对于工作岗位,在一家创业公司,数据科学家通常要做很多类型的工作,其扮演的工作角色可能包括:执行、数据挖掘师、数据工程师或架构师、研究员、统计学家、建模师(做预测建模等等)和开发人员。

机器学习对比深度学习

这些都是数据科学的分支。当这些算法被用于自动化的时候,就像在自动飞行或无人驾驶汽车中,它被称为人工智能,更具体的细说,就是深度学习。如果数据收集自传感器,通过互联网进行传输,那就是机器学习或数据科学或深度学习应用到了 IoT 上。机器学习一系列在数据集上进行训练的算法,来做出预测或采取形同从而对系统进行优化。

机器学习与统计学之间的区别

《Machine Learning Vs. Statistics》这篇文章试图解答这个问题。这篇文章的作者认为统计学是带有置信区间(confidence intervals)的机器学习,是为了预测或估计数量。

数据科学对比机器学习

机器学习和统计学都是数据科学的一部分。机器学习中的学习一词表示算法依赖于一些数据,来调整模型或算法的参数;这包含了许多的技术,比如回归、朴素贝叶斯或监督聚类。但不是所有的技术都适合机器学习;数据科学要比机器学习广泛。数据科学中的数据可能并非来自机器或机器处理(调查数据可能就是手动收集,临床试验涉及到专业类型的小数据)。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值