机器学习入门

机器学习是什么?

从数据处理来看,简单地说,就是计算机自动从已有数据中寻找规律,然后用规律解决新问题。

这个说法虽然比较易于理解,但是同时把机器学习的范围限定窄了。

我自己认为 机器学习 强调的是 学习能力,虽然它的目标是解决问题。就像人一样,人的学习能力并不是为了特定目标或者特定任务存在的,而是客观存在着,并且在遇到各种需求时演变到解决各种问题的能力。

当然这也是大多数学者的观点,机器学习 更加贴近于 AI ,那么这其中就又有一个问题,AI需不需要模拟人的 遗忘能力呢?遗忘或者忘记 应该是人比较苦恼的事情,但是对于机器学习来说,遗忘是不是有可能有助于解决问题呢?

前不久,据说一位大牛在国际会议中批评了当前学术界过于偏重 基于统计学的机器学习 与 工程应用,而 对 基于模型的所谓智能实质核心 的研究不足。当然立即引来其他学者的反驳。作为我自己的立场,统计学无论是理论还是应用上 的突破 至少说明它在一定程度上是有用的,正确的。但是也不得不承认 ,统计理论的机器学习 构建了 越来越多的 “看不见”的模型, 也是令学者很苦恼的。

引:

在MIT 150周年庆的Brains, Minds, and Machines研讨会上, Prof. Noam Chomsky发表了一个观点,他的大概意思是有很多语言模型采用统计的方法建模,有些取得了成功,但他觉得大多数是失败的,他觉得应该更多重视简洁的,公式化的理论,而非这些统计上的结论,正如下文中他所言:

It's true there's been a lot of work on trying to apply statistical models to various linguistic problems. I think there have been some successes, but a lot of failures. There is a notion of success ... which I think is novel in the history of science. It interprets success as approximating unanalyzed data.

 

以往的研究,让我们渴望得到 问题的模型,特别是抽象的模型(泛化能力很强,如 E=mc^2)。可是机器学习,或者 AI,到底是不是具有 抽象模型,直到现在还不知道,恐怕还需要学者继续探索很长时间。

那么按通常的研究方法,机器学习应该至少有三个要素:模型(目标,输入,输出等),策略(模型优化?),算法(模型参数计算,估计,优化等)。

最常见的机器学习任务是 分类。分类器也有多种类型,常见的有:

基于概率的 ,如 NB朴素贝叶斯,MLE最大似然估计;

基于空间分割的,如SVM,perception感知机等;

其他 如 KNN k近邻等。

常见问题主要是 分类,回归(拟合),图模型(搜索),聚类,排序。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值