分类的定义:
通过学习得到目标函数f(也叫“分类模型”),把每个属性集x映射到一个预先定义好的类称号y。
相关定义:训练集、属性、类标号、模型、测试集
分类与聚类的区别:
聚类:无指导的学习,事先没有标签,而通过某种成因分析找出事物之间存在聚集性原因的过程。“面对一堆数据,将这堆数据分成几类”。
分类:有指导的学习,在聚类的前提下,按照某种标准给对象贴标签,再根据标签来分类。
评价方法:
①预测的准确率:混淆矩阵
②速度:构造模型的速度、利用模型进行分析的速度
③强壮型:给定噪声数据或具有空缺值的数据,模型正确的预测能力