常见分类算法

本文详细介绍了四种常见的分类算法:朴素贝叶斯、ID3、C4.5和KNN。朴素贝叶斯算法基于贝叶斯定理和特征条件独立假设;ID3算法利用信息熵和信息增益构建决策树;C4.5优化了ID3,引入信息增益率和Gini指标,但对数据量敏感;KNN则是基于邻近度的分类方法,简单但计算量大。每种算法都有其优缺点,适用于不同场景。
摘要由CSDN通过智能技术生成

一、朴素贝叶斯算法(NBC)

1.1 简介

朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类算法,是应用最广泛的分类算法之一。

该算法假定给定目标值时属性之间相互条件独立,即没有哪个属性变量对于决策结果占很大(很小)的比重,一定程度上降低了贝叶斯分类算法的分类效果,但在实际应用场景中,极大简化了贝叶斯方法的复杂性。

1.2 算法原理


样本数据集D={d1,d2,d3,…dn},
样本数据的特征属性集X={x1.x2,…xd},
类变量Y={y1,y2,…ym}
即D可以分为ym类别,其中x1.x2,…xd相互独立且随机,
则Y的先验概率Yprior=P(Y),Y的后验概率Ppost=P(Y|X)
在这里插入图片描述
朴素贝叶斯基于各特征之间相互独立,在给定类别为y的情况下,上式可进一步表示为:
在这里插入图片描述
后验概率为:
在这里插入图片描述
由于P(X)大小固定不变,在比较后验概率时,只比较上式的分子部分即可,因此可以得到一个样本数据属于类别yi的朴素贝叶斯计算如下:
在这里插入图片描述

1.3 优缺点

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值