一、机器学习概述
机器学习的本质就是找出一个函数,让这个函数可以根据我们的输入,得到我们所需要的输出。
1.定义一个函数空间(即模型)(选择不同的模型可能会得到不同的结果)
2.定义目标函数
3.根据目标函数选择出最有的模型(函数)
回归:Regression是一种machine learning的task,当我们说:我们要做regression时的意思是,machine找到的function,它的输出是一个scalar,这个叫做regression。【线性回归,非线性回归(深度学习,SVM,决策树,K-NN)】
分类:在Regression中机器输出的是一个数值,在Classification里面机器输出的是类别。假设Classification问题分成两种,一种叫做二分类输出的是是或否(Yes or No);另一类叫做多分类(Multi-class),在Multi-class中是让机器做一个选择题,等于是给他数个选项,每个选项都是一个类别,让他从数个类别里选择正确的类别。【深度学习,SVM,决策树,logistic回归,K-NN】
二、机器学习方法分类
1.有监督:需要大量数据进行标注,并且我们都会假设training和inference时,采用的数据服从相同的分布(distribution)、来源于相同的特征空间(feature space)
那么针对标签多这一问题,我们可以采用半监督学习和迁移学习:
2.半监督:使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。
3.迁移学习(Transfer Learning):从以前的任务当中去学习知识(knowledge)或经验,并应用于新的任务当中。换句话说,迁移学习目的是从一个或多个源任务(source tasks)中抽取知识、经验,然后应用于一个目标领域(target domain)当中去。
但是上述机器学习的方法(有监督),都需要大量的训练资料(Training Data),大量的标注
4.无监督:大量无标签数据
5.强化学习:根据反馈结果进行不断地学习