C: 算法总结-----应用场景与优缺点

说明:  根据日常项目经验整理, 有些本人不常用的信息可能不是很全. 欢迎补充 


一.监督学习算法

 

K-近邻

线性模型

朴素贝叶斯

说明

  1. 即邻居个数,一般用较小的邻居得到比较好的结果.
  2. 默认距离

1.尤其是回归模型中正则化的调节非常重要

1.

参数

  1. K
  2. 数据点之间的度量方法

1.alpha/C正则化参数

1.

优点

  1. 容易理解,不需要过多的调节就可以得到不错的性能
  2. 速度快
  1. 训练速度,预测速度非常快
  2. 对稀疏数据很有效,可以推广到非常大的数据集
  3. 特征数量大于样本数量,训练效果非常好
  1. 效率高,训练速度更快
  2. 适用高维稀疏数据
  3. 对参数路鲁棒性好
  4. 是很好的基准模型

缺点

  1. 不适用于特征多的数据集
  2. 不适用于稀疏数据集

 

01.泛华能力稍差

 

不适用于高维稀疏数据

适用于高维稀疏数据

适用于高维稀疏数据

注: 朴素贝叶斯的许多优点和缺点都与线性模型相同.

 (未完成: 线性模型拆分)

 

DT(决策树)

RF(随机森林)

GBDT(梯度回升回归树)

说明

控制复杂度的方法:预剪枝和后剪枝

本质上是随机的;树越多,对随机状态选择的鲁棒性就越好

  1. 设置不同随机状态可以彻底改构建的模型
  2. 参数越大越好,对更多的树取平均可以降低过拟合
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值