一、机器学习介绍
人工智慧(目标):使机器像人一样拥有智慧。
机器学习machine learning(方法):让机器具有学习的能力,其中深度学习是机器学习中的一种方法。
DO:让机器通过人所给的资料,寻找到一个解决问题的function。
语音辨识:输入声音——输出文字
影像辨识:输入图片——输出图片内的内容
学习过程(Training)
Machine learning framework分为三个步骤:
1.Model:也就是function set(集合),包含众多function(f1,f2,f3…),从中找到一个function
2.TRAINING DATA(训练资料):告诉机器一个合适的function的输入和输出和两者的关系,让其判断function的好坏。
其中告诉机器Input和Output叫做Supervised Learning(监督学习)
3.通过有效的演算法,从function set中挑选出“Best”Function —— f*
二、监督学习(Supervised Learning)
监督学习需要大量的training data。从training data中可以知道function的input和output之间的关系。
在监督学习下进行学习,需要告诉机器function的input和output是什么。这个output往往需要人工标注,叫做label。
1.Regression(回归)是一种machine learning的task,做regression的意思是使machine需要的function的输出是一个scalar(标量数值),这个叫做regression。
2.Classification(分类),在Classification里机器输出的是类别。
Classification问题分成两种:二分类输出的是Yes or No;多分类(Multi-class)是给机器无数个选项,每个选项都是一个类别,让机器从这些类别里选择正确的类别。
Model有很多种,最简单的就是线性模型,但我们会花很多时间在非线性的模型上。在非线性的模型中最耳熟能详的就是Deep learning。比如它可以做影像辨识,让机器下围棋(分类)
监督学习中的结构化学习(structured learning)
structured learning 让机器输出的是要有结构性的。
语音辨识:机器输入是声音讯号,输出是一个句子,句子由词汇组成。
机器翻译:输入中文句子翻译成英文句子输出。
人脸辨识:输入图片,人物在图片中的不同位置。需要机器标注出来。
三、半监督学习((Semi-Supervised Learning)
减少label需要的量
没有label的data,他可能也是对学习有帮助
四、迁移学习(Transfer learning)
减少data量的方向。
迁移学习:做分类问题,只有少量有label的data,还有大量可能有label也可能无label的data,也就是有很多不相关的图片。
五、无监督学习(Unsupervised Learning)
在完全没有任何label的情况下,到底机器可以学到什么样的事情。
六、强化学习(reinforcement learning)
监督学习:告诉机器正确答案是什么。
强化学习:没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。它要回去反省检讨哪一步做的不好。
例:Alpha Go
监督学习:告诉机器,看到什么盘下什么。
强化学习:机器跟对手互下,不断的下棋,最后赢了,机器就会知道做的好,没赢,就是做的不好,再进行学习的过程。
总结:
学习情景:监督学习,半监督学习,无监督学习,强化学习,迁移学习
监督学习中的任务(问题):回归,分类,结构化
分类任务的模型:线性模型,深度学习,SVM,决策树