常用算法优缺点

朴素贝叶斯 常用于文本分类

对缺失值不敏感、能处理多分类、算法简单

需要计算先验概率、先验有一定的错误率;模型假设是各特征相互独立,所以面对相关性较强的特征可能分类效果不好

本质是根据先验概率和数据来估计后验分布,也有一定的错误率

 

KNN

简单有效

类别重叠时,效果比别的分类器好一些

可用于非线性分类;

对数据没有假设,准确度高,对异常值不敏感;

缺点

计算量大;

样本不平衡问题

需要大量的内存;

 

决策树

逻辑清晰,便于向业务人员解释

不需要考虑特征之间的相关性

分类速度快

不需要对数据进行预处理

缺点

容易过拟合  忽略数据之间的相关性。信息增益偏向取值较多的特征   增益比偏向取值较少的特征

 

 

K-means

算法简单 容易实现 适合数值型数据

当簇密集时 分类效果较好

大规模数据收敛慢

对噪声和孤点较敏感

对初始点敏感  k值难取

 

逻辑回归

主要是线性划分即 假设数据服从伯努利分布  通过极大似然函数 利用梯度下降求解 从而实现二分类的方法

模型简单 可解释性好

运算内存需求小 训练速度快  输出结果就是各样本的概率分数 便于划分阈值

 

模型简单  分类效果有限   无法筛选变量  很难处理样本不平衡的问题  对异常值敏感 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值