《李宏毅机器学习》学习笔记 - Task01 机器学习介绍

Task01 机器学习介绍

机器学习的概念

让机器具有学习的能力。——李宏毅

人工智能是人类的目标,机器学习是达成目标的手段。

机器学习(Machine Learning)所做的事情,可以想成是要让机器具有一个能力,这种能力是根据你提供给他的资料,它去寻找出我们要寻找的函数(function)。

例如,在语音辨识问题中,我们要找一个function,它的输入是声音讯号,它的输出是语音辨识的文字;在影像辨识问题中,那就是找一个function,输入一张图片,输出图片里面东西的描述;在Alpha GO中,要做一个可以下围棋的机器时,需要的就是一个function。这个function的输入是围棋上十九乘十九的棋盘。告诉机器在十九乘十九的棋盘上,哪些位置有黑子,哪些位置有白子。然后机器就会告诉你,接下来下一步应该落子在哪。

机器学习任务分类

回归(Regression)

回归也可以叫函数逼近,是机器学习的任务的一种,意思是机器找到的function,它的输出是一个标量,这个叫做regression。

例如,在PM2.5的预测问题中,也就是说你要找一个function,这个function的输入是一个时间,输出是该时间的PM2.5数值。

分类(Classification)

分类也可以叫模式识别,任务是指机器找到的function的输出的是类别。分类问题可以分成两种,一种叫做二分类,输出的是是或否;另一类叫做多分类,在多分类中是让机器做一个选择题,等于是给他数个选项,每个选项都是一个类别,让他从数个类别里选择正确的类别。

例如,二分类可以鉴别垃圾邮件,将其放到垃圾箱。多分类可以对文章进行分类,输入是一则新闻,输出是新闻属于哪个类别。

聚类(Clustering)

聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离。简单地说就是把相似的东西分到一组,聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起。

因此,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了,因此聚类通常并不需要使用训练数据进行学习,这在Machine Learning中被称作Unsupervised Learning (无监督学习)。在有类标签的样本的信息帮助下获得比只用无类标签的样例得到的结果更好的簇,提高聚类方法的精度,这在Machine Learning中被称作Semi-Supervised Learning (无监督学习)。

结构化学习(Structured Learning)

在机器学习的任务上除了回归、分类等,还有一类的问题是结构化学习,其让机器的输出是有结构性的。

例如,在机器翻译问题中,机器输入是中文句子,输出是一个英文句子。句子是要很多词汇按照一定语法拼凑完成,它是一个有结构性的目标。

机器学习方法分类

监督学习(Supervised Learning)

监督学习是指:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。

监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。

半监督学习(Semi-Supervised Learning)

半监督学习是监督学习与无监督学习相结合的一种学习方法。

对于半监督学习,其训练数据的一部分是有标签的,另一部分没有标签,而没标签数据的数量常常极大于有标签数据数量(这也是符合现实情况的)。隐藏在半监督学习下的基本规律在于:数据的分布必然不是完全随机的,通过一些有标签数据的局部特征,以及更多没标签数据的整体分布,就可以得到可以接受甚至是非常好的分类结果。

迁移学习(Transfer Learning)

迁移学习 顾名思义就是把已训练好的模型(预训练模型)参数迁移到新的模型来帮助新模型训练。考虑到大部分数据或任务都是存在相关性的,所以通过迁移学习我们可以将已经学到的模型参数(也可理解为模型学到的知识)通过某种方式来分享给新模型从而加快并优化模型的学习效率不用像大多数网络那样从零学习。

无监督学习(Unsupervised Learning)

如果所有训练数据都有标签,则为有监督学习。如果数据没有标签,显然就是无监督学习了。

强化学习(Reinforcement Learning)

在强化学习里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。

例如,机器跟对手互下,机器会不断的下棋,最后赢了,机器就会知道下的不错,但是究竟是哪里可以使它赢,它其实是不知道的。我们知道Alpha Go其实是用监督学习加上强化学习去学习的。先用棋谱做监督学习,然后在做强化学习,但是强化学习需要一个对手,如果使用人当对手就会很让费时间,所以机器的对手是另外一个机器。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值