【数据挖掘·总复习】各大算法优缺点汇总||总结整理||~自食用

41 篇文章 1 订阅
9 篇文章 3 订阅

step by step.

目录

 1. Apriori算法

(1)优点

(2)缺点

2.1 决策树算法(ID3)

(1)优点

(2)缺点

2.2 ID3与C4.5的比较

3. 贝叶斯算法

(1)优点

(2)缺点

4. BP人工神经网络算法

(1)优点

(2)缺点

5. 支持向量机

(1)优点

(2)缺点

6. K-means聚类算法

(1)优点

(2)缺点

7. K-中心点算法

(1)优点

(2)缺点


要看具体章节复习汇总请见👇

【scau数据挖掘·总复习】博客汇总||第一章~第九章+密度聚类_半段烟y9的博客-CSDN博客step by step.目录第二章第三章第四章第五章第六章第七章第八章、第九章、补充知识第二章【数据挖掘·总复习】第二章-数据预处理||详细整理||知识点+例题||考点有_半段烟y9的博客-CSDN博客详细复习资料https://blog.csdn.net/weixin_51159944/article/details/120444098第三章【数据挖掘·总复习】第三章-关联规则挖掘||Apriori||详细整理||知识点+例题||考点有_半段烟y9的博https://blog.csdn.net/weixin_51159944/article/details/122111501

自己辛苦总结的,点个赞鼓励一下啦~


 

 1. Apriori算法

(1)优点

迭代算法。

数据采用水平组织方式。(即,👉{ 啤酒,奶粉,酸奶} 👈横向)

采用Apriori优化方法(废话)。

适合事务数据库的关联规则挖掘。

适合稀疏数据集。(即,频繁项目集长度稍小的数据集)

(2)缺点

多次扫描数据库,产生很大I/O负载。

可能产生庞大的候选集。

在频繁项目集长度变大的情况下,运算时间显著增加。


2.1 决策树算法(ID3)

(1)优点

算法理论清晰。

方法简单。

学习能力较强。

(2)缺点

信息增益的计算依赖于特征数目较多的特征,但属性取值最多的属性不一定最优。

非递增。

单变量决策树(分支节点上只考虑单个属性)。

抗噪性差。

2.2 ID3与C4.5的比较

C4.5采用增益比例,而不是信息增益。


3. 贝叶斯算法

(1)优点

逻辑简单。

易于实现。

时间/空间开销较小。

算法稳定。

具有较好的健壮性。

(2)缺点

属性间类条件独立的设定不成立。 


4. BP人工神经网络算法

(1)优点

非线性映射能力。

自学习和自适应能力。

泛化能力。

容错能力。

(2)缺点

局部极小化问题。

BP神经网络算法收敛速度慢。

结构选择不一。

应用实例与网络规模的矛盾问题。

预测能力与训练能力的矛盾问题。

样本依赖性问题。


5. 支持向量机

(1)优点

非线性映射的理论基础。

最大化分类边际的方法核心,最优超平面的目标。

支持向量的决定作用。

最终决策函数只由少数支持向量确定。帮助抓住关键样本。

(2)缺点

以实施大规模训练样本。

以解决多分类问题。 


6. K-means聚类算法

(1)优点

简单快速。

对处理大数据集具有高效。算法经常以局部最优结束。

算法尝试找出使平方误差函数值最小的K个划分。

(2)缺点

 只有在簇平均值被定义的情况下才可以使用。

要求用户给出K值。

初始值不同时,聚类结果可能不同。

对于噪声敏感,少量的该类数据能对平均值产生较大影响。👉K-中心点!解决!


7. K-中心点算法

(1)优点

对噪声点不敏感。

结果与输入顺序无关。

(2)缺点

高耗时性。👈迭代+最近邻搜索👉大量重复计算 

  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值