对于任何一个事件或者概念的了解或者入门,我习惯于用“DFCG”的理论来解释与认识。“D”就是define的意思,也就是对某一个概念先确定一个定义,这个定义可以是在你经过大量的阅读相关的概念的基础上自己理解的定义,也可以是别人比较关于某个概念比较经典的定义,但只有一个核心,你必须吃透它,理解它;“F”指的是这一概念的特征,相比较其他的概念,它有什么不一样的地方,它有什么显著的地方或者说不同于其他的地方;“C”指的是对这一个概念进行分类,分类时要进行思考,从什么样的维度进行分类,可以分为哪几类,分的类是否互斥,是否涵盖了所有;“G”指的是这一事情或者想表达什么样的意思,也就是他的目标是啥,它想干一件什么样的事情,可以与它的作用联系起来一起考虑。
对于机器学习也是一样,下面我也将用“DFCG”的理论来进行理解与讲解。
首先是第一步,关于它的“D”。查阅相关的文献,机器学习主要有以下几种定义:(1) 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能;(2) 机器学习是对能通过经验自动改进的计算机算法的研究;(3) 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。 通过对这三个定义的理解,我们可以看到它们之中出现频率最高的词是“经验(数据)”与“计算”(算法或者计算机),其实这两个词语就是机器学习的核心,如果再稍微深入进行了解,也即是它的作用,还要加上“预测”。接下来,我将用一张图来说明机器学习理解的核心:经验(数据)、计算、预测。
我们来想象一下我们(人)是如何进行学习的,在大多数的情况下,我们往往利用的是我们在以往的生活中所积累的经验,然后对于这些经验,我们进行归纳总结(从科学的角度来讲,可以分为归纳与演绎),然后我们形成了所谓的“规律”,也就是直觉,感觉。当我们遇到新的问题的时候或者面对不确定事件的时候,我们常常会利用这些“规律”进行判断分析,从而进行推测,进行决策,指导