机器学习是什么?
从数据处理来看,简单地说,就是计算机自动从已有数据中寻找规律,然后用规律解决新问题。
这个说法虽然比较易于理解,但是同时把机器学习的范围限定窄了。
我自己认为 机器学习 强调的是 学习能力,虽然它的目标是解决问题。就像人一样,人的学习能力并不是为了特定目标或者特定任务存在的,而是客观存在着,并且在遇到各种需求时演变到解决各种问题的能力。
当然这也是大多数学者的观点,机器学习 更加贴近于 AI ,那么这其中就又有一个问题,AI需不需要模拟人的 遗忘能力呢?遗忘或者忘记 应该是人比较苦恼的事情,但是对于机器学习来说,遗忘是不是有可能有助于解决问题呢?
前不久,据说一位大牛在国际会议中批评了当前学术界过于偏重 基于统计学的机器学习 与 工程应用,而 对 基于模型的所谓智能实质核心 的研究不足。当然立即引来其他学者的反驳。作为我自己的立场,统计学无论是理论还是应用上 的突破 至少说明它在一定程度上是有用的,正确的。但是也不得不承认 ,统计理论的机器学习 构建了 越来越多的 “看不见”的模型, 也是令学者很苦恼的。
引:
在MIT 150周年庆的Brains, Minds, and Machines研讨会上, Prof. Noam Chomsky发表了一个观点,他的大概意思是有很多语言模型采用统计的方法建模,有些取得了成功,但他觉得大多数是失败的,他觉得应该更多重视简洁的,公式化的理论,而非这些统计上的结论,正如下文中他所言:
以往的研究,让我们渴望得到 问题的模型,特别是抽象的模型(泛化能力很强,如 E=mc^2)。可是机器学习,或者 AI,到底是不是具有 抽象模型,直到现在还不知道,恐怕还需要学者继续探索很长时间。
那么按通常的研究方法,机器学习应该至少有三个要素:模型(目标,输入,输出等),策略(模型优化?),算法(模型参数计算,估计,优化等)。
最常见的机器学习任务是 分类。分类器也有多种类型,常见的有:
基于概率的 ,如 NB朴素贝叶斯,MLE最大似然估计;
基于空间分割的,如SVM,perception感知机等;
其他 如 KNN k近邻等。
常见问题主要是 分类,回归(拟合),图模型(搜索),聚类,排序。