监督:数据点已知结果
无监督:数据点有未知的结果
回归:结果是连续的(数值)
分类:结果是一个范畴
监督学习综述
Data withanswers + Model ----fit----> model
Data withoutanswers + model -----Predict---> Predictedanswers
分类:分类答案
Emails labeled asspam/not spam + Model----fit-------—>model
Unlabeledemails + model ---Predict---- > Spam ornot spam
机器学习词汇
目标:数据的预测类别或价值(列预测)
特征:用于预测的数据的属性(非目标列)
标签:单个数据点的目标值