分类
通过已有的训练集,输入相应的模型中训练拟合,在通过检验集进行进行验证,从而预测未知样本类;
常用的分类法有决策树分类,基于规则的分类,神经网络,支持向量机, 朴素贝叶斯分类法,通常每一种分类方法都对应这一种模型算法。决策树模型就是其中的一种学习算法
混淆矩阵
通过将计数存放在混淆矩阵中,根据正确和错误预测来评估模型的性能
| |预测的类 |
| |:类=1 |类=0 |
|实际的类|类=1|:f _11 |: f _10|
| |:类=0|:f _01 |:f _00 |
通过性能度量正确率、错误率来比较不同模型之间的性能
正确率= (f_11 + f _00) / (f _11+f _10+f _01+ f _00)
错误率= (f_01 + f _10) / (f _11+f _10+f _01+ f _00)
决策树原理
import 根节点
if 条件
叶节点
elseif 条件
叶节点
elseif
...
end