分类概述

最新推荐文章于 2021-08-19 10:49:52 发布

宝G

最新推荐文章于 2021-08-19 10:49:52 发布

阅读量471

点赞数

分类专栏：数据挖掘

本文链接：https://blog.csdn.net/u013611461/article/details/53142137

版权

数据挖掘专栏收录该内容

8 篇文章 0 订阅

订阅专栏

决策树

决策树以自顶向下, 递归分治的方式构造
属性的选择基于启发式或统计度量(例如,信息增益)
节点上的样本递归地基于选定的属性划分停止划分的条件

朴素贝叶斯

先给个实例
类: C1:buys_computer=‘yes’ C2:buys_computer=‘no’

这里写图片描述

数据样本
X =(age<=30, income=medium, student=yes, credit_rating=fair)

每个类的先验概率P(Ci)可以根据训练样本计算
P(buys_computer = yes) = 9/14 = 0.643
P(buys_computer = no) = 5/14 = 0.357

使用以上概率,我们得到 P(X|Ci)
P(X|buys_computer=“yes”)= 0.222  0.444  0.667  0.667 =0.044
P(X|buys_computer=“no”)= 0.6  0.4 x 0.2  0.4 =0.019

P(X|Ci) P(Ci )
P(X|buys_computer=“yes”) * P(buys_computer=“yes”)=0.028
P(X|buys_computer=“no”) * P(buys_computer=“no”)=0.007

因此,对于数据样本X,朴素贝叶斯分类预测buys_computer =” yes”

如果P(xk|Ci)为0,进行拉普拉斯变换

优点
易于实现，在数据较少的情况下仍然有效，可以处理多类别问题
在大部分情况下能够得到很好的结果
当类条件独立假定成立时,朴素贝叶斯分类是最精确的
缺点
假定: 类条件独立 , 因而损失精度
实践中, 变量之间存在依赖关系—-类条件独立的假定不切实际
对于输入数据的准备方式较为敏感
适用数据类型：标称型数据

混淆矩阵评估分类器好坏

这里写图片描述

宝G

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分类概述

决策树决策树以自顶向下, 递归分治的方式构造属性的选择基于启发式或统计度量(例如,信息增益)节点上的样本递归地基于选定的属性划分停止划分的条件朴素贝叶斯先给个实例类: C1:buys_computer=‘yes’ C2:buys_computer=‘no’数据样本 X =(age<=30, income=medium, student=yes, credit_rating=fai
复制链接

扫一扫