课程大纲
Learning with Different Output Space Y
按照输出空间的类型,我们可以把机器学习问题分为四类
binary classification:
y={−1.+1} ,比如垃圾邮件分类问题multiclass classification: y={1,2,...K} ,比如硬币识别问题
regression: y=R ,比如房价预测问题
structured learning: y=structured ,比如序列标注问题
Learning with Different Data Label yn
按照数据标签的完备程度,可以把机器学习问题分为四类
supervised:所有的数据都有标签
unsupervised:所有的数据都没有标签
semi-supervised:只有部分数据有标签
reinforcement:通过奖励和惩罚来表示好坏
Learning with Different Protocol
按照与计算机的交互数据的方式,将机器学习问题分为三类
batch:一次把所有的数据喂给机器
online:每次为一条数据给机器,不断地喂
active::机器主动找我们要数据
Learning with Different Input Space
按照不同的输入空间,将机器学习问题分为三类
concrete:数据特征是一些比较具体的特征,有物理意义,比如说用户的个人信息
raw:数据特征有简单的物理意义,比如说图片的像素
abstract:数据特征几乎没有物理意义,比如说用户的id