《Deep Learning》第五章笔记（上）

最新推荐文章于 2024-08-21 13:24:32 发布

芬哈本尼斯III

最新推荐文章于 2024-08-21 13:24:32 发布

阅读量119

点赞数

分类专栏：深度学习小菜鸡文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fehabenis/article/details/108386601

版权

本文是《Deep Learning》第五章的笔记，主要探讨了深度学习的基本假设，包括独立同分布和估计理论。重点讲解了最大似然估计（MLE），及其与损失函数、KL散度和交叉熵的关系。通过最小化交叉熵，可以实现模型对数据分布的拟合。

摘要由CSDN通过智能技术生成

Deep Learning 第五章

1.基本假设（独立同分布~iid）

训练集与数据集的样本独立的由分布函数 $p_{data}$ 产生

2.估计

$p_{model}(x;\theta)$ 为一族由θ确定的在相同空间上的概率分布。
使用这一分布来将输入 $x$ 映射到实数来估计真实概率分布 $p_{data}(x)$

3.最大似然估计（MLE)

定义： $\theta_{ML}=\arg\max_{\theta} \ p_{model}(\mathbb{X};\theta) =\arg\max_{\theta} \ \prod_{i=1}^mp_{model}(x^{(i)};\theta)$
log形式： $\arg\max_{\theta}\sum_{i=1}^mlogp_{model}(x^{(i)};\theta)$

最低0.47元/天解锁文章

芬哈本尼斯III

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《Deep Learning》第五章笔记（上）

Deep Learning 第五章1.基本假设（独立同分布~iid）训练集与数据集的样本独立的由分布函数pdatap_{data}pdata产生2.估计 pmodel(x;θ)p_{model}(x;\theta)pmodel(x;θ)为一族由θ确定的在相同空间上的概率分布。使用这一分布来将输入xxx映射到实数来估计真实概率分布pdata(x)p_{data}(x)pdata(x)3.最大似然估计（MLE) 定义：θML=arg⁡max⁡θ pmodel(
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。