机器学习打卡笔记
day 1 认识机器学习
人工智慧是我们想要达成的目标,而机器学习是想要达成目标的手段,希望机器通过学习方式,他跟人一样聪明。而深度学习就是机器学习的其中一种方法。
其实是让机器它有自己学习的能力,也就做machine learning的方向。讲的比较拟人化一点,所谓machine learning的方向,就是编写段程序,然后让机器人变得聪明,使得它拥有学习的能力。接下来,就像教一个婴儿、教一个小孩一样的教它,并不是写程序让他做到这件事,而是写程序让它具有学习的能力。然后接下来,就可以用像教小孩的方式告诉它。假设要叫他学会做语音辨识,就告诉它这段声音是“Hi”,这段声音就是“How are you”,这段声音是“Good bye”。希望他学会这些声音,然后给它一个新的声音,它就可以产生语音辨识的结果。
如果希望它学会怎么做影像辨识,只是需要告诉它:看到这张图片,你要说这是猴子;看到这张图片,然后说是猫;看到这张图片,可以说是狗。它具有了影像辨识的能力,接下来看到它之前没有看过的猫,希望它可以认识。
如果讲的通俗一点的话,machine learning所做的事情,可以想成就是在寻找一个function,要让机器具有一个能力,这种能力是根据你提供给他的资料,它去寻找出我们要寻找的function。还有很多关键问题都可以想成是我们就是需要一个function。
监督学习
回归是一种机器学习的任务,机器需要找到function,它的输出是一个标量的,这个叫做回归。举例来说,假如要你做PM2.5的预测(比如说预测明天上午的PM2.5) ,也就是说需要找一个function,这个function的输出是未来某一个时间PM2.5的一个数值,这个是一个回归的问题。
例如输入九月一日与二日上午的PM2.5,通过预测得到3日上午的PM2.5预测值,等等。
分类和回归的差别在于机器输出的结果类型不一样。在回归中机器输出的是一个数值,而在分类中机器输出的是类别,是归属。举个例子,当邮箱收到一封新的信件时,可以先做一个判断,这封信件是有用的还是没有用的垃圾信件,二分类可以用于这个问题。同样只需要一个function,然后让它的输出只有两个,一个是一个否,是代表新的信件是垃圾信件,否则代表是有用的信件。
半监督学习
上述说的都是监督学习,监督学习的问题是我们需要大量的训练数据。训练的数据将告诉我们要找的function的输入和输出之间的关系。如果我们在监督学习下进行学习,我们需要告诉机器function的输入和输出分别是什么。这个输出往往没有办法用很自然的方式取得,需要人工的力量把它标注出来,这些function的输出叫做标签。半监督学习就是想办法减少标签的量。
无监督学习
无监督学习就是把数据直接丢给机器,让它无师自通,看看它自己学习能得出什么结果。
例如带机器去动物园,然后让它看了很多动物之后,它就学会了自己创造动物。通过观察大量的动物,它就可以画出一些动物,比如长着乳牛斑纹的狗。
强化学习
将强化学习和监督学习进行比较时,在监督学习中会告诉机器正确答案是什么。若现在用监督学习的方法来训练一个聊天机器人,训练的方式是:告诉机器,现在使用者说了hello,你就说hi,现在使用者说了byebye ,你就说good bye。所以当有一个类似家教一样的人在旁边教它每件事情时,这就是监督学习。
强化学习是并没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是它做的好还是不好。若现在用强化学习的方法来训练一个聊天机器人,训练的方法是把机器发到线下,让它和来往的客人进行对话,然后讲了半天以后,最后勃然大怒的电话挂掉。那机器就学到一件事情就是刚才做错了。但是它不知道哪边错了,它就要回去自己想道理,是一开始就不应该打招呼吗?还是中间不应该在骂脏话了之类。它不知道,也没有人告诉它哪里做的不好,它要回去反省检讨哪一步做的不好。机器要在强化学习的情况下学习,机器是非常聪明的。 强化学习也是比较符合我们人类真正的学习的情景,就像你在学校里学习,老师会告诉你答案,但在真实社会中没人会告诉你正确答案,你只知道你做得好还是做得不好。