机器学习是什么?————深度学习之旅(一)

一、机器学习是什么

 在了解深度学习之前,我们要先了解下机器学习什么?顾名思义,机器学习就是让机器学习,这么说有点笼统,那么我们类比下自身,我们学习是为了掌握知识、掌握能力、掌握技巧、最终能够进行比较复杂或者高要求的工作。那么,同样的,我们让机器学习,不管学习什么,最终目的都是让它独立或至少半独立地进行相对复杂或者高要求的工作,对于机器学习,我们的关注点从数学科学转移到自然科学

机器学习的本质目的--让机器帮助人类做一些大规模的数据识别、分拣、规律总结等人类做起来比较花时间的事情。

我们从来历史来看,机器逐步替代人力是社会发展一个不可替代的趋势。从农耕时代,我们的祖先就已经使用很多的工具,石斧、镰刀……在近现代之后,第一次和第二次工业革命之后,机器在更多的领域取代了人力,大大降低了劳动成本。

从信息化时代之后,我们能用一些特定的程序或者算法让电脑能在特定的条件作出相应的判断,但是,这些只是在程序员赋予一定的程序指令下完成的。

以上的这些,并没有任何“学习”的行为。而机器学习这个领域的思路与以上这些有很大的区别。我们要让机器能通过数据进行统计和归纳来分辨出之后所发生的事。

机器学习从学习的种类来说,最常见的分为两种,一种叫无监督学习,一种叫有监督学习

所为有监督学习,举个例子,假设我们要设置一个分类器,我们可以将输入的邮件分拣为“普通邮件”和“垃圾邮件”量大类别,我们要先先给予分类器大量的垃圾邮件后(这个过程相当于训练),由分类器对垃圾邮件样本的各种特种就行统计和归纳来辨别出垃圾邮件。从这里可以看出,我们使用统计信息而非逻辑来分析实验结果。

而无监督学习,人们在获得训练的向量数据后在没有标签的情况下尝试找出其内部蕴含关系的一种挖掘过程,也就是给予每一个样本有着明确的标签,最后我们只是要总结出这些训练样本向量与标签的映射关系。

二、聚类

 聚类是一种典型的“无监督学习”,是把物理对象或抽象对象的集合分组为由彼此类似的对象组成的多个类的分析过程。其实,直白点,就是分类问题的一种统计分析算法。

比如,鸟有很多种类,但是我们把这些分成一大类--鸟类,这些都是带有一定的特征,比如翅膀,通过我们的归纳总结,来区分出不同的类别。同样,机器做聚类学习的时候,我们每种算法都对应由相应的计算原则,可以把输入的各种看上去彼此“相近”的向量分在一个群组中。然后下一步,人们通常更有针对性地去研究每一组聚在一起的对象所拥有的共性以及那些远离各个群组的不同点--这种不同点可以让我们更好的区分。

在整个过程中,从获得具体的样本向量,到得到聚类结果,人们是不用进行干预的,这就是“非监督”一词的由来。

三、回归

回归最简单的思想就是倒推。

最常用的回归有两大类——一类是线性回归、一类是非线性回归。

线性回归:在观察和归纳样本的过程中认为向量和最终的函数值呈线性的关系。然后设计这种关系为:y=f(x)=wx+b。

非线性回归类中,在机器学习领域应用最多的当属逻辑回归。它和线性回归都叫回归,但是逻辑回归看上去更像分类。

在这种模型中观察者假设的前提是y只有两种值:一种是1,一种是0,或者说“是”与“否”的这种判断。设计关系为

y=f(x)=1/(1+e^-(wx+b)); 可看出0<y<1。

四、分类

分类是机器学习中使用的最多的一大类算法,我们通常也喜欢把分类算法叫做“分类器”。

分类的训练过程和回归的训练过程一样,都是极为套路化的程序。

1)输入样本和分类标签

2)建立映射假说的某个y=f(x)的模型

3)求解出全局的损失函数Loss和待定系数w的映射关系,Loss=g(w)。

4)通过迭代优化逐步降低Loss,最终找到一个w能使召回率和精确率满足当前场景需要。

五、小结

简单来说,机器学习就是人类定义一定的计算机算法,让计算机根据输入的样本和一些人类的干预来总结并归纳其特征与特点,并用这些特征和特点与一定的学习目标形成映射关系,进而自动化作出相应反应的过程。


参考:《白话深度学习与TensorFlow》




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值