常见的分类技术
基本分类器
- decision tree
- rule-based methods
- nearest-neighbor
- neural networks
- deep learning
- naive bayes and bayesian bilief networks
- svm
决策树
1、根据训练数据集,画出决策树
2、将该树用于预测test data
- 要注意的是,找出最优二分类决策树是个NP问题
决策树的推导
有很多种算法可以用:
- hunt‘s 算法
1、如果Dt包含属于yt相同类别的记录,则t是标记为yt的叶子节点
2、如果Dt包含属于多个类的记录,请使用属性测试将数据拆分为较小的子集。将过程递归地应用于每个子集。
3、直到所有记录属于同一类或具有相同的属性值,停止拆分
- 遇到连续属性的时候,我们可以将其离散化以形成序数分类属性,