自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_51861731的博客

原创 transformer论文理解（从self-attention开始）

2.decoder中的Masked Multi-Head Attention的q、k、v均来自上一个decoderlayer的输出，但进行了mask操作，将当前位置之后的向量的v设为负无穷，屏蔽掉当前位置之后的影响，使得输出只依赖于当前输入与此位置之前的信息。3.decoder中的Multi-Head Attention的k、v来自encoder的输出，而q来自Masked Multi-Head Attention的输出，这使得decoder的每个位置都可以关注到输入序列的全部信息。

2023-04-03 21:16:10 218 1

原创 CRNN模型理解及代码修改

特征序列中每个特征向量对应特征图的每一列，而特征图每一列又对应原始图像的一块矩形区域，由此可得图2，即每个特征向量对应一块矩形区域。直接计算原始图像与标签之间损耗。3.image = torch.FloatTensor(opt.batchSize, 3, opt.imgH, opt.imgH)后一个opt.imgH修改为opt.imgW（这种错误都有，麻了呀）基于词典D，从词典中选择最有可能的序列，为了解决时耗问题，可采取无词典与有词典相结合的方式，先依据无词典方式找到几个与真实序列很相近的候选序列，

2023-03-27 20:10:17 944 9

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

QiferG CSDN认证博客专家 CSDN认证企业博客

码龄4年

IP 属地：上海市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

2: 原创

161万+: 周排名

147万+: 总排名

1159: 访问

: 等级

29: 积分

5: 粉丝

2: 获赞

10: 评论

11: 收藏

私信

关注

热门文章

最新评论

transformer论文理解（从self-attention开始）
CSDN-Ada助手: 非常感谢你分享了这篇有关transformer的博客，文章内容清晰明了，解释得非常透彻。我希望你能够继续分享更多类似的知识，让我们可以更好地了解这个主题。此外，除了上文提到的技能外，还有一些在transformer中非常重要的知识点，例如position encoding和residual connection等，它们也值得我们深入了解。期待你的下一篇文章！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
CRNN模型理解及代码修改
QiferG: http://t.csdn.cn/EVEeb看一下能不能打开，也可以直接搜博主"无左无右"训练crnn的文章，我是用的他的数据集
CRNN模型理解及代码修改
dei想个名字: 数据集失效了，博主可以给个链接吗
CRNN模型理解及代码修改
QiferG: 把词典改成包含汉字的就行，现在的是只有数字和字母
CRNN模型理解及代码修改
qq_57906638: 如果还要识别文字的话，该怎么修改代码呀？

最新文章

提示

确定要删除当前文章？

取消删除