通过学习p(y|x)来分类需要估计的参数个数

最新推荐文章于 2022-02-18 16:29:15 发布

dreamhunter_lan

最新推荐文章于 2022-02-18 16:29:15 发布

阅读量663

点赞数 1

分类专栏： Data Mining 文章标签： homework 文档

本文链接：https://blog.csdn.net/dreamhunter_lan/article/details/6674332

版权

Data Mining 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

通过学习p(y|x)来进行分类，计算在新的x的条件下的p(y|x)，然后判断x应该属于哪个类。

之前一直想不通要计算p(y|x)需要估计的参数个数，其实是这样的：

这里这假设x=(x1, x2, ..., xn)，xi与y都是二元随机变量，就是xi与y都只取0和1中的一个值。例如x=(x1, x2)，要估算的参数是：

于是想到贝叶斯公式：

p(y|x)=p(x|y)p(y)/p(x)

这时要对于p(x|y=0)需要计算的参数是2^n-1，因为最后一个可以由1-前面的和得到，由于y能取两种值，所以对于p(x|y)要算的参数是2(2^n-1)个，对于p(y)，要计算1个，另一个可以由1-已经算出的那个得到，总共要计算的参数个数是2(2^n-1) + 1个，还是很恐怖。（p(x)通常不用计算）。

于是朴素贝叶斯中那个条件独立（Conditional Independence）就出来，x与y条件独立，如果p(x|y, z) = p(x|z)，也就是说在给出z的条件下，x的概率与有没有y是无关的。所以：

p(x1, x2, x3|y) = p(x1|y)p(x2, x3|y, x1)=p(x1|y)p(x2|y, x1)p(x3|y, x1, x2) = p(x1|y)p(x2|y)p(x3|y)，于是p(x1, x2, ..., xn|y) = p(x1|y) p(x2|y)...p(xn|y)

于是要估计的参数变为了2n+1。（可能会有点搞不懂为啥不是2(n-1)+1举些例子看看就好了）

就这样大大减少了需要估计的参数。唉，这个问题困扰了好久，哈哈~~

这里举一个具体的例子说明一下在conditional independence下需要估计的参数个数（CMU Machine Learning的HomeWork）。

类标y签能取{T, F}，x=<x1, x2, ..., xn>，x1是boolean的，{x2, ..., xn}是连续的变量，假设对于每一个连续的变量xi，p(xi|y)服从高斯分布。算出用朴素贝叶斯来对一个新的x进行分类需要估计的参数的个数。