【联系】二项分布的对数似然函数与交叉熵（cross entropy）损失函数

五道口纳什

于 2017-07-19 18:10:55 发布

阅读量9.7k

点赞数 1

分类专栏：联系

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lanchunhui/article/details/75433608

版权

联系专栏收录该内容

2 篇文章

订阅专栏

1. 二项分布

二项分布也叫 0-1 分布，如随机变量 $x$ 服从二项分布，关于参数 $\mu$ （ $0\leq \mu\leq 1$ ），其值取 1 和取 0 的概率如下：

{p (x = 1 | μ) = μ p (x = 0 | μ) = 1 - μ

$\left\{ \begin{split} &p(x=1|\mu)=\mu\\ &p(x=0|\mu)=1-\mu \end{split} \right.$

则在 $x$ 上的概率分布为：

Bern (x | μ) = μ x (1 - μ) 1 - x

$\text{Bern}(x|\mu)=\mu^x(1-\mu)^{1-x}$

2. 服从二项分布的样本集的对数似然函数

给定样本集 $\mathcal D=\left\{x_1, x_2, \ldots, x_B\right\}$ 是对随机变量 $x$ 的观测值，假定样本集从二项分布 $p(x|\mu)$ 中独立（ $p(x_1, x_2, \ldots, x_N)=\prod_{i}p(x_i)$ ）采样得来，则当前样本集关于 $\mu$ 的似然函数为：

p (D | μ) = \prod n = 1 N p (x n | μ) = \prod n = 1 N μ x n (1 - μ) 1 - x n

$p(\mathcal D|\mu)=\prod_{n=1}^Np(x_n|\mu)=\prod_{n=1}^N\mu^{x_n}\left(1-\mu\right)^{1-x_n}$

从频率学派的观点来说，通过最大似然函数的取值，可以估计参数 $\mu$ ，最大化似然函数，等价于最大化其对数形式：

则有：

ln p (D | μ) = = = ln μ \sum n = 1 N x n + ln (1 - μ) \sum n = 1 N 1 - x n ln μ \sum n = 1 N x n + ln (1 - μ) (N - \sum n = 1 N x n) \sum n = 1 N x n ln μ + (1 - x n) ln (1 - μ)

$\begin{split} \ln p(\mathcal D| \mu)=&\ln \mu\sum_{n=1}^Nx_n+\ln(1-\mu)\sum_{n=1}^N1-x_n\\ =&\ln \mu\sum_{n=1}^Nx_n+\ln(1-\mu)\left(N-\sum_{n=1}^Nx_n\right)\\ =&\sum_{n=1}^Nx_n\ln \mu+(1-x_n)\ln(1-\mu) \end{split}$

求其关于 $\mu$ 的导数，解得 $\mu$ 的最大似然解为：

μ M L = 1 N \sum n = 1 N x n

$\mu_{ML}=\frac1N\sum_{n=1}^Nx_n$

这里我们仅关注：

ln P (D | μ) = \sum n = 1 N x n ln μ + (1 - x n) ln (1 - μ)

$\ln P(\mathcal D|\mu)=\sum_{n=1}^Nx_n\ln \mu+(1-x_n)\ln(1-\mu)$

3. 交叉熵损失函数

L H (x, z) = - \sum n = 1 N x n log z n + (1 - x n) log (1 - z n)

$L_H(\mathbf x,\mathbf z)=-\sum_{n=1}^Nx_n\log z_n+(1-x_n)\log(1-z_n)$

$\mathbf x$ 表示原始信号， $\mathbf z$ 表示重构信号。（损失函数的目标是最小化，似然函数则是最大化，二者仅相差一个符号）。

五道口纳什

博客等级

码龄14年

3595
原创

3964
点赞

9522
收藏

7427
粉丝

关注

私信

热门文章

分类专栏

最新评论

[Math Processing Error] 问题的解决（F5刷新页面与 Ctrl/Shift + F5 刷新页面的区别）
2301_81505543: 还有没有其他方法啊，ctrl+f5不刷新，ctrl+R刷新了，但没有，急死了
音频、视频等文件格式（.ts、.meta）及其认识
Shuuc: meta 文件并不能打开
补码：统一加减运算
做而论道_CS: 虽然，计算机使用的是：二进制数。但是，进行算术计算时，二进制数也是数，与十进制是雷同的。二进制数，也是数，它也是完全正常的数字。并非是什么乱七八糟的：原码反码补码。千万不要听信那些砖家胡讲！就说四位二进制数吧。四位数范围是：0000 ~ 1111。相当于十进制：0 ~ 15。出现进位，即：2^4 = 16。这些数中，既没有小数点，也没有符号位。它们，都是正整数！计算机砖家就给它们编造了一个名称：无符号数。其实，这就是【忽悠】！计算机中有个加法器，其运算规则是：逢二进一。找两个无符号数相加，列竖式如下：　　　0 1 0 1　= 5 　　＋1 1 1 1　= 15 －－－－－－－－－－－进 1、 0 1 0 0　= 16 + 4 = 20 这就是 “无符号数” 的加法：　　5 + 15 = 16 + 4 = 20。计算完全正确！－－－－－－－－－－－－－－－－－但是，如果你忽略了进位呢？（或者说：故意舍弃了进位。）这就少算了 16 ！那么就是：5 + 15－16 = 5－1 = 4。此时的＋15，就相当于－1 了！为什么是－1 ？因为你：舍弃了进位，少算了 16。所以有：＋15－16 = －1。加法的竖式，依然如下：　　　0 1 0 1　= 5 　　＋1 1 1 1　= 15 （=－1）－－－－－－－－－－－略掉、0 1 0 0　= 4 但是，此时，这可就是【减法运算】了。你看吧，本来是两个 “无符号数” 相加，丢了进位，就变成了 “有符号数” 相减！由此可知，所谓的 “有符号数、无符号数、符号位”，就是瞎掰！二进制数，也就是普通的数字！只是因为： “弄丢了进位”，才会出来 “负数” 和 “减法”。
matplotlib tricks（关闭坐标刻度、坐标轴不可见）
qq_37404964: set_xticklabels([])是可以的
matplotlib tricks（关闭坐标刻度、坐标轴不可见）
qq_37404964: ax.set_xticks([])会报错啊

大家在看

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

五道口纳什 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。