笔记

最新推荐文章于 2020-03-05 21:19:55 发布

丨Modred丨

最新推荐文章于 2020-03-05 21:19:55 发布

阅读量173

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37175369/article/details/84557369

版权

算法专栏收录该内容

24 篇文章 1 订阅

订阅专栏

看完论文发现一些之前思考过的问题又忘了，以后稍微记一下笔记，省的再忘

1. 为什么在时序预测模型中最后计算-log p(y|x)作为损失函数时都是用y1+....+yt直接得出的

这里不是强制认为每个点都是独立的，而是通过链式法则，由于计算时使用的是RNN，那么每个输出可以理解为logp(p(yt)|p(y1),p(y2),...,p(yt-1), x) 这样每个点的输出求和之后因为是log域，那么在内部转化为累乘，就可以由链式法则得到logp(y|x)

2. CTC为什么没有显式的计算loss

以为在反向传播时，loss的结果理论上不会影响反向传播的过程，只是提供了一个感官上判断是否收敛的依据。考虑

l = a*x1+b*x2，那么需要调整a 使得 l 减小，整个等式的5个数中，理论上只要知道了a和x1，就足够了，即使x2是x1的函数，也没有关系，也就是只和 l 与 a的偏导有关，实际上loss的大小根本不会影响反向传播的结果

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
笔记

看完论文发现一些之前思考过的问题又忘了，以后稍微记一下笔记，省的再忘1. 为什么在时序预测模型中最后计算-log p(y|x)作为损失函数时都是用y1+....+yt直接得出的这里不是强制认为每个点都是独立的，而是通过链式法则，由于计算时使用的是RNN，那么每个输出可以理解为logp(p(yt)|p(y1),p(y2),...,p(yt-1), x) 这样每个点的输出求和之后因为是log域...
复制链接

扫一扫

专栏目录

博客等级

码龄7年

24
原创

197
点赞

603
收藏

131
粉丝

关注

私信

热门文章

分类专栏

session 1篇
quartz 1篇
js 4篇
shiro 1篇
linux 6篇
docker 4篇
k8s 1篇
tensorflow 11篇
NLP 4篇
线性代数 3篇
语音 9篇
python 2篇
算法 24篇
神经元网络基础 3篇
视觉 4篇

最新评论

关于线性代数的通俗理解
张嘴C语言: 非奇异矩阵就是行列式不为0的矩阵，行列式不为0，说明满秩
目前自然语音合成（TTS）进度一点见解
无瑕剑客: 2023年10月，目前关于这个ai音频有什么进步吗
二重积分计算（几何法）
qq_45843315: 为什么极坐标系中的二重积分, 同样可以化归为二次积分来计算
关于线性代数的通俗理解
Tumb1eweed: 英雄所见略同我在思考基坐标变换的时候想法和这个是不谋而合的
二重积分计算（几何法）
萝卜没长草: 拜托，这很好耶🌹,就是排版看着有些乱和累。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。