吃完大西瓜 第七章贝叶斯分类

1.什么是贝叶斯决策论?

简述:贝叶斯决策论是指概率框架下进行决策的基本方法。比如,对分类任务来说,求得决策相关的所有概率后,基于概率和误判损失来进行最优分类

2.简述贝叶斯公式:
简述:贝叶斯公式P(H|E)=P(E|H)P(H)/P(E)
贝叶斯公式计算的是在已知证据E下,当前假设H发生的概率,即H的后验概率。揭示了这个概率与H的先验和似然P(E|H)有关。P(E)可以视作概率标准化因子。

3.什么是贝叶斯判定准则和贝叶斯最优分类器?

简述:对于判定准则h希望能够最小化总体风险R(h)=E(Rh(h(x)|x)).若对每个样本都能使条件风险R(h(x)|x)最小,自然总体风险也最小。
所以贝叶斯判定准则描述为使得每个样本的条件风险最小的准则,此时产生对应的分类器被称为贝叶斯最优分类器。

4.什么是生成模型,什么是判别模型?
简述:生成模型指对样本的联合分布进行建模,如在分类问题中关于样本x与其标记y的联合分布p(x,c)建模,当已知联合分布时,可以求得条件部分从而进行分类作出符合贝叶斯最优的决策。与之相对的是判别模型,直接对条件概率进行建模。

5.朴素贝叶斯的关键假设是?什么是半朴素贝叶斯?
简述:条件独立性,假设每个属性间相互独立。
由于条件独立性很难在现实应用中达到,因此半朴素贝叶斯引入了“独依赖估计”,保留了属性间的一些强相关信息。假设所有属性都单独依赖于一个属性,该属性被称为“超父”

6.什么是TAN?它是如何生成的?
简述:TAN结构同样基于保留属性间的强相关性的想法,TAN通过最大生成树算法生成。步骤为:
(1)计算所有属性间的互信息
(2)以属性为节点,两两间互信息构建网状数据结构图,两结点间的权重为互信息。
(3)调用最大生成树算法,获得仅保留强相关性的最大带权树。
(4)加入类别节点y,添加y到所有属性的有向边

7.怎样改进半朴素贝叶斯中的SPODE算法?
简述:半朴素贝叶斯中仅选择一个超父结构,可以通过集成的方法改进。轮流让各个属性成为超父,保留有足够训练数据集支持的所有分类器结果进行集成。

8.什么是贝叶斯网?
简述:贝叶斯网又称为信念网,是由一个有向无环图来描述属性间的相关性,保留了更多的信息。其中一个节点为1个属性,其上附有条件概率表描述该节点属性与其他属性的联合概率分布。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值