常用分类算法的优缺点

瞻邈

已于 2025-06-01 21:46:14 修改

阅读量2.3k

点赞数

分类专栏：机器学习文章标签：分类数据挖掘人工智能

于 2022-03-04 17:21:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xhtchina/article/details/123281081

版权

机器学习专栏收录该内容

23 篇文章

订阅专栏

1. Bayes 贝叶斯分类法

1.1. 优点

1 ）所需估计的参数少，对于缺失数据不敏感。

2 ）有着坚实的数学基础，以及稳定的分类效率。

1.2. 缺点

1 ）需要假设属性之间相互独立，这往往并不成立。（喜欢吃番茄、鸡蛋，却不喜欢吃番茄炒蛋）。

2 ）需要知道先验概率。

3 ）分类决策存在错误率。

2. Decision Tree决策树

2.1. 优点

1 ）不需要任何领域知识或参数假设。

2 ）适合高维数据。

3 ）简单易于理解。

4 ）短时间内处理大量数据，得到可行且效果较好的结果。

5 ）能够同时处理数据型和常规性属性。

2.2. 缺点

1 ）对于各类别样本数量不一致数据，信息增益偏向于那些具有更多数值的特征。

2 ）易于过拟合。

3 ）忽略属性之间的相关性。

4 ）不支持在线学习。

3. SVM支持向量机

3.1. 优点

1 ）可以解决小样本下机器学习的问题。

2 ）提高泛化性能。

3 ）可以解决高维、非线性问题。超高维文本分类仍受欢迎。

4 ）避免神经网络结构选择和局部极小的问题。

3.2. 缺点

1 ）对缺失数据敏感。

2 ）内存消耗大，难以解释。

3 ）运行和调参略烦人。

4. KNN K近邻

4.1. 优点

1 ）思想简单，理论成熟，既可以用来做分类也可以用来做回归；

2 ）可用于非线性分类；

3 ）训练时间复杂度为 O(n) ；

4 ）准确度高，对数据没有假设，对 outlier 不敏感；

4.2. 缺点

1 ）计算量太大。

2 ）对于样本分类不均衡的问题，会产生误判。

3 ）需要大量的内存。

4 ）输出的可解释性不强。

5. Logistic Regression逻辑回归

5.1. 优点

1 ）速度快。

2 ）简单易于理解，直接看到各个特征的权重。

3 ）能容易地更新模型吸收新的数据。

4 ）如果想要一个概率框架，动态调整分类阀值。

5.2. 缺点

特征处理复杂。需要归一化和较多的特征工程。

6. Neural Network 神经网络

6.1. 优点

1 ）分类准确率高。

2 ）并行处理能力强。

3 ）分布式存储和学习能力强。

4 ）鲁棒性较强，不易受噪声影响。

6.2. 缺点

1 ）需要大量参数（网络拓扑、阀值、阈值）。

2 ）结果难以解释。

3 ）训练时间过长。

7. Adaboosting

7.1. 优点

1 ） adaboost 是一种有很高精度的分类器。

2 ）可以使用各种方法构建子分类器， Adaboost 算法提供的是框架。

3 ）当使用简单分类器时，计算出的结果是可以理解的。而且弱分类器构造极其简单。

4 ）简单，不用做特征筛选。

5 ）不用担心 overfifitting 。

7.2. 缺点

对 outlier 比较敏感

参考文献

深度学习500问

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。