李宏毅《机器学习》笔记(1)--机器学习基本概念梳理

一、人工智能、机器学习与深度学习:

  • 可以把人工智能当作是要实现的目标,那么机器学习就是想要达成目标的手段,深度学习是机器学习的一种方法。
  • 机器学习:寻找一个函数(function)。eg: 语音识别

做语音识别其实相当于是在找一个函数,输入是声音讯号,输出是语音识别的文字。

二、机器学习的三个步骤:

Step1:准备一个函数集合,里面有成千上万的函数,这个集合也叫做model(模型)。

Step2:让机器能够衡量一个函数是好还是不好,eg:在监督学习里,机器可以根据训练数据判断一个function是好的还是不好的。

Step3:让机器有一个有效率的演算法,能从集合里面挑出最好的函数。

三、一些名词概念:

监督学习(supervised learning):需要大量的训练数据告诉我们要找的函数的输入(input)和输出(output)之间的关系。这个输出往往没有办法用很自然的方式取得,需要人为把它标注出来,这些函数的输出也叫做标注(label)。在监督学习中我们会告诉机器正确答案是什么。例如:若现在我们要用监督学习的方法来训练一个聊天机器人,训练方式会是:告诉机器,若使用者说了hello,你就说hi;若使用者说了byebye ,你就说good bye。所以机器相当于有一个人当他家教在他旁边手把手的教他每件事情,这就是监督学习。

半监督学习(semi-supervised learning):减少标注(label)需要的量。比如:你有少量的猫和狗的已标注的数据(labelled data),但是同时你又有大量的未标注的数据(Unlabeled data)。在半监督学习的技术中,这些没有标注的数据,他可能也对学习有帮助,训练时可以使用上。

迁移学习(Transfer learning):另一种减少数据用量的方法。比如:还是猫和狗的分类问题,一样只有少量的有label的数据。但是我们现在还有大量的data,这些大量的data中可能有label也可能没有label。并且他跟我们现在要考虑的问题是没有什么特别的关系的,我们要分辨的是猫和狗的不同,但是这边有一大堆其他动物的图片或者其他一大堆不相干的图片,它到底可以带来什么帮助,这个就是迁移学习要讲的问题。

无监督学习(unsupervised learning):在完全没有任何label的情况下,机器可以学到什么样的事情。比如,假设让机器去动物园它看一大堆的动物,它能不能够在看了一大堆动物以后,它就学会自己画一些动物出来等等。

强化学习(reinforcement learning):在强化学习里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。比如:若我们用强化学习方法来训练一个聊天机器人的话,他训练的方法会是这样:让机器和客人对话,然后客人想了半天以后,最后仍旧勃然大怒把电话挂掉了。那机器就学到一件事情就是刚才做错了。但是他不知道哪边错了,它就要回去自己想道理,是一开始就不应该打招呼吗?还是中间不应该在骂脏话了之类。它不知道,也没有人告诉它哪里做的不好,它要回去反省检讨哪一步做的不好。Alpha Go就是用监督学习加上强化去学习的。先用棋谱做监督学习,然后在做强化学习,但是强化学习需要一个对手,如果使用人当对手就会很让费时间,所以机器的对手是另外一个机器。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值