基本概念:测试集,特征集,监督学习,非监督学习,半监督学习,分类,回归
一个简单的监督学习例子
温度:暖,冷
湿度:普通,大
风力:强,弱
水温:暖,冷
预报:一样,变化
享受运动:是,否
1.这是一个分类问题,最终的结果只有true/false的答案
2.x是每一个实例,X是全部的实例,也就是实例集
3.y,c(x) ->是最后的结局
4.学习的目标就是 x->y
训练集/训练样例:用来进行训练的数据集,用来生成模型或算法的数据集
测试集/测试样例:用来测试以及学习好的模型或者算法
特征向量:属性的集合,通常用一个向量表示,附属于一个实例
标记:c(x),实例类别的标记
正例:比如是
反例:比如否
下一个回归的案例
回归:目标标记为连续性数值
有监督学习:训练集有类别标记
无监督学习:训练集无类别标记
半监督学习:有些训练集有标记,有些无标记
机器学习步骤框架
1)把数据拆分为训练集和测试集
2)用训练集和训练集的特征向量来训练算法
3)用学习来的算法运用在测试集上来评估算法(涉及到跳转参数,用验证集)