经典分类模型及适用场景

最新推荐文章于 2023-06-16 17:24:48 发布

qq_33761777

最新推荐文章于 2023-06-16 17:24:48 发布

阅读量1.7k

点赞数

本文链接：https://blog.csdn.net/qq_33761777/article/details/108843074

版权

svm/神经网络：svm是天生的结构风险最小化分类，相对很稳定并且过拟合风险较小（别给太膨胀的核函数参数就行）。在样本数量少的时候，很多模型（尤其是深度神经网络）容易过拟合，svm在这方面就挺不错。但当样本数量达到一定量级之后，svm的计算复杂度会显著上升，神经网络的泛化能力也得以提升。加之神经网络结构设计灵活，这时svm就不再是最优的选择。
数据类型比较杂，有categorical也有numerical的时候，用Tree好一些，用SVM都不太合适，因为SVM是基于Kernel，Kernel作用于连续变量效果更好。NB也可以。

**决策树系列：**基于信息论的分类器，十分适合离散特征的处理。对于离散特征，其它很多模型都需要对其进行编码，得到很稀疏的编码向量再进行模型拟合，因较大的过拟合风险对样本量有较高要求。决策树则统计离散特征后直接计算信息增益等，再加上有各类集成树模型的存在（比如快速稳定可并行的xgb）可以进一步提升性能，所以在很多离散特征满天飞的算法比赛里树模型独占鳌头。

**贝叶斯分类器：**计算方便，分类理论对数据分布的假设比较多。当假设和数据分布比较接近时，分类效果会好一些。
变量分布，如果分布十分不均匀，比如说有一个变量全是0，Tree根本找不到cut-point，NB就好些

作者：ZJU某小白
链接：https://www.zhihu.com/question/318728147/answer/640908155
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

qq_33761777

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
经典分类模型及适用场景

svm/神经网络：svm是天生的结构风险最小化分类，相对很稳定并且过拟合风险较小（别给太膨胀的核函数参数就行）。在样本数量少的时候，很多模型（尤其是深度神经网络）容易过拟合，svm在这方面就挺不错。但当样本数量达到一定量级之后，svm的计算复杂度会显著上升，神经网络的泛化能力也得以提升。加之神经网络结构设计灵活，这时svm就不再是最优的选择。数据类型比较杂，有categorical也有numerical的时候，用Tree好一些，用SVM都不太合适，因为SVM是基于Kernel，Kernel作用于连续变量效
复制链接

扫一扫