项目实训六

最新推荐文章于 2024-10-14 09:08:48 发布

qq_51946537

最新推荐文章于 2024-10-14 09:08:48 发布

阅读量222

点赞数

分类专栏：项目实训文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51946537/article/details/124320835

版权

项目实训专栏收录该内容

15 篇文章 2 订阅

订阅专栏

算法改进策略

这两周在看其他论文的时候，当看到 Improving Attention-Based Handwritten Mathematical Expression Recognition with Scale
Augmentation and Drop Attention 认为其中的思想Scale Augmentation对现有模型会有一定的提高，下面对Scale Augmentation思想进行简述：

与手写文本不同，ME具有复杂的二维结构和各种大小的符号.如果通过保持高宽比将多行MES标准化为同一尺度，一些符号(例如上标、下标和点)比其他符号要小，这就增加了识别难度。我们不是将MES正常化到相同的规模，而是原有的训练集，在每次训练时，保持每张图片的纵横比不变，MES被随机地扩展到另一个尺度，并且被零填充到固定的大小。在测试阶段，MES是零填充到固定大小。这样训练编解码器来适应各种符号的大小。
由于实现所用的GPU资源有限，将图片扩充到较大的规模时，在保持原来的batchsize将就会有显存溢出的风险，于是我们将batchsize调小，这样模型能正常训练，只是所需要的时间会增加，具体的实验结果将会在下一篇博客中介绍。

新型的树形解码器

此外，在阅读更新的论文TDv2: A Novel Tree-Structured Decoder for Offline Mathematical Expression
Recognition发现，目前存在一种新型树形解码器，识别的正确率也相对比较乐观，我们后面的工作将会着重放在树形解码器上，尝试复现论文，并通过实验观测准确率是否会有所提高。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。