【无标题】

机器学习打卡笔记

day 1 认识机器学习

人工智慧是我们想要达成的目标,而机器学习是想要达成目标的手段,希望机器通过学习方式,他跟人一样聪明。而深度学习就是机器学习的其中一种方法。
其实是让机器它有自己学习的能力,也就做machine learning的方向。讲的比较拟人化一点,所谓machine learning的方向,就是编写段程序,然后让机器人变得聪明,使得它拥有学习的能力。接下来,就像教一个婴儿、教一个小孩一样的教它,并不是写程序让他做到这件事,而是写程序让它具有学习的能力。然后接下来,就可以用像教小孩的方式告诉它。假设要叫他学会做语音辨识,就告诉它这段声音是“Hi”,这段声音就是“How are you”,这段声音是“Good bye”。希望他学会这些声音,然后给它一个新的声音,它就可以产生语音辨识的结果。
如果希望它学会怎么做影像辨识,只是需要告诉它:看到这张图片,你要说这是猴子;看到这张图片,然后说是猫;看到这张图片,可以说是狗。它具有了影像辨识的能力,接下来看到它之前没有看过的猫,希望它可以认识。
如果讲的通俗一点的话,machine learning所做的事情,可以想成就是在寻找一个function,要让机器具有一个能力,这种能力是根据你提供给他的资料,它去寻找出我们要寻找的function。还有很多关键问题都可以想成是我们就是需要一个function。
在这里插入图片描述

监督学习

回归是一种机器学习的任务,机器需要找到function,它的输出是一个标量的,这个叫做回归。举例来说,假如要你做PM2.5的预测(比如说预测明天上午的PM2.5) ,也就是说需要找一个function,这个function的输出是未来某一个时间PM2.5的一个数值,这个是一个回归的问题。
例如输入九月一日与二日上午的PM2.5,通过预测得到3日上午的PM2.5预测值,等等。
在这里插入图片描述
分类和回归的差别在于机器输出的结果类型不一样。在回归中机器输出的是一个数值,而在分类中机器输出的是类别,是归属。举个例子,当邮箱收到一封新的信件时,可以先做一个判断,这封信件是有用的还是没有用的垃圾信件,二分类可以用于这个问题。同样只需要一个function,然后让它的输出只有两个,一个是一个否,是代表新的信件是垃圾信件,否则代表是有用的信件。

半监督学习

上述说的都是监督学习,监督学习的问题是我们需要大量的训练数据。训练的数据将告诉我们要找的function的输入和输出之间的关系。如果我们在监督学习下进行学习,我们需要告诉机器function的输入和输出分别是什么。这个输出往往没有办法用很自然的方式取得,需要人工的力量把它标注出来,这些function的输出叫做标签。半监督学习就是想办法减少标签的量。

无监督学习

无监督学习就是把数据直接丢给机器,让它无师自通,看看它自己学习能得出什么结果。
在这里插入图片描述
例如带机器去动物园,然后让它看了很多动物之后,它就学会了自己创造动物。通过观察大量的动物,它就可以画出一些动物,比如长着乳牛斑纹的狗。

强化学习

将强化学习和监督学习进行比较时,在监督学习中会告诉机器正确答案是什么。若现在用监督学习的方法来训练一个聊天机器人,训练的方式是:告诉机器,现在使用者说了hello,你就说hi,现在使用者说了byebye ,你就说good bye。所以当有一个类似家教一样的人在旁边教它每件事情时,这就是监督学习。

强化学习是并没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是它做的好还是不好。若现在用强化学习的方法来训练一个聊天机器人,训练的方法是把机器发到线下,让它和来往的客人进行对话,然后讲了半天以后,最后勃然大怒的电话挂掉。那机器就学到一件事情就是刚才做错了。但是它不知道哪边错了,它就要回去自己想道理,是一开始就不应该打招呼吗?还是中间不应该在骂脏话了之类。它不知道,也没有人告诉它哪里做的不好,它要回去反省检讨哪一步做的不好。机器要在强化学习的情况下学习,机器是非常聪明的。 强化学习也是比较符合我们人类真正的学习的情景,就像你在学校里学习,老师会告诉你答案,但在真实社会中没人会告诉你正确答案,你只知道你做得好还是做得不好。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

西在路上

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值