Machine Learning Foundations –lesson 3
学习的类型
不同的输出空间即我们常说的数据集中有多个或者两个类别的数据;还包含输出空间是数值型的回归问题
Learning with Different Output Space Y- binary classification
- multiclass classification
- regression: Y = R
- structured learning: Y = structures词性标注
带不同标签的数据:k
Learning with Different Data Label y n- supervised
- unsupervised
- 密度估计
- 异常值检测
- 聚类
- semi-supervised
leverage unlabeled data to avoid ‘expensive’ labeling充分利用标记少量样(how) - reinforcement: implicit Yn by goodness( ỹn )
不同训练模型的方法
Learning with Different Protocol f ⇒ (x n , y n )- batch learning
- Active Learning: Learning by ‘Asking’
- Online learning
在线学习用已有模型对未知数据进行预测,拿到新的样本用来模型更新。例如PLA算法,他就是可以用在线学习的思想,如果新的样本分错了,那就进行模型更新,否则模型不发生变化。
不同的输入空间
Learning with Different Input Space X- concrete features具有些物理意义
- raw features需要进行转换的特征,因为原始特征有物理意义(例如像素,音频, 视觉)
- Abstract Features no (or little) physical meaning(ID特征)