统计学、人工智能、机器学习、数据挖掘的区别与联系之(1) 概念

自认为从事机器学习已经有些时日了,常常听到统计学、人工智能、机器学习、数据挖掘、机器视觉吧啦吧啦….自己也曾迷茫,自己究竟算哪个方向的呢?因此起意整理一套系列文章将这些概念描述清楚,旨在理清这些错综复杂的概念,促使我们正对性学习我们关注的方向,我想这对我们搞算法也是相当必要的。


  • 统计学
    统计学(英语:Statistics)是在资料分析的基础上,自17世纪中叶产生比逐步发展起来的一门学科,它是研究如何测定、收集、整理、归纳和分析反应数据资料,一边给出正确信息的科学。统计学广泛的应用在各门科学,从自然科学、社会科学到人文科学,甚至被用来做工商业和政府的情报决策。随着大数据时代的来临,统计的面貌也逐步被改变,与信息、计算机等领域密切结合,是数据科学(Data Science)中的重要主轴之一。
    譬如在一组数据中,可以摘要并描述这部分数据的集中和离散情况,该用法被称作描述统计学。另外,观察者已数据的形态,建立一个用来解释随机性和不确定性的数学模型,以之来推理研究中的步骤和母体,这种用法被称作推理统计学。这两种用法都可以被称作应用统计学。梳理统计学则是讨论背后的数论基础的学科。
    统计可以推测趋势和规律,说明自然和人文现象。

  • 人工智能
    人工智能(英语:Artificial Intelligence, AI)也称为机器智能,是指由人工制造出来的系统表现出来的智能。通常人工智能是指通过普通电脑实现的智能。
    人工智能的研究是高度技术和专业的,各分支领域都是深入且不相通的,因而设计范围极其广泛。
    人工智能的研究课分为几个技术问题。其分支领域主要集中在解决具体恩特,其一是,如何使用各种不同的工具完成特定的应用程序。AI的核心问题包括推理、知识、规划、学习、交流、感知、移动和操作物体的能力等。强人工智能目前仍然是该领域的长远目标。不签比较流行的方法包括统计方法,技术智能和传统意义上的AI。目前大量的工具应用了人工智能,其中包括搜索和数学优化、逻辑推演。而基于仿生学认知心理学,以及概率论和经济学的推演算法等等也在逐步探索当中。
    这里写图片描述

  • 机器学习
    机器学习(英语:Machine Learning, ML)是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。
    机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等领域。
    这里写图片描述

  • 数据挖掘
    数据挖掘(英语:Data Mining)又称资料勘探、资料挖掘、资料采矿。图是资料库知识发现(英语:Knowledge-Discovery in Databases,KDD)中的一个步骤。数据挖掘是从大量的资料中自动搜索隐藏于其中的有着特殊关联性(属于Association rule learning)的信息的过程。资料挖掘通常与电脑科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
    这里写图片描述
展开阅读全文

没有更多推荐了,返回首页