统计学 数据挖掘 机器学习 深度学习
统计学:(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析、总结,做出推断和预测,为相关决策提供依据和参考。
数据挖掘:即data mining,就是从大量的数据中,提取隐藏在其中的,事先不知道的、但潜在有用的信息的过程。数据挖掘的目标是建立一个决策模型,根据过去的行动数据来预测未来的行为。比如分析一家公司的不同用户对公司产品的购买情况,进而分析出哪一类客户会对公司的产品有兴趣。在讲究实时、竞争激烈的网络时代,若能事先破解消费者的行为模式,将是公司获利的关键因素之一。数据挖掘是一门交叉学科,它涉及了数据库,人工智能,统计学,可视化等不同的学科和领域。
机器学习:machine learning,是对计算机一部分数据进行学习,然后对另外一些数据进行预测与判断。机器学习的概念就是通过输入海量训练数据对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测。
机器学习的核心是“使用算法解析数据,从中学习,然后对新数据做出决定或预测”。也就是计算机利用以获取的数据得出某一模型,然后利用此模型进行预测的一种方法。
深度学习:deep learning,深度学习就是把计算机要学习的东西看成一大堆数据,把这些数据丢进一个复杂的、包含多个层级的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合,就保留这个网络作为目标模型,如果不符合,就一次次地、锲而不舍地调整网络的参数设置,直到输出满足要求为止。
下图是它们之间的关系: