项目实训七

最新推荐文章于 2024-09-15 22:31:42 发布

qq_51946537

最新推荐文章于 2024-09-15 22:31:42 发布

阅读量141

点赞数

分类专栏：项目实训文章标签： python

本文链接：https://blog.csdn.net/qq_51946537/article/details/124508526

版权

项目实训专栏收录该内容

15 篇文章 2 订阅

订阅专栏

本文回顾了ScaleAugmentation在数学公式识别中的应用，发现模型对特征变化影响不大。着重讨论了注意力机制的问题，计划通过错误分析改进。同时，树形解码器(treeDecoder)的优越性在结构泛化方面得到强调，未来将重点优化其实现。

摘要由CSDN通过智能技术生成

Scale Augmentation

对于上周提出的Scale Augmentation思想，经过将近一个周的多次训练，测试结果吓显示模型并没有在2014年的测试集上正确率并没有提高，但是也没有降低，这说明经过规模扩充的数据集，经过DenseNet网络提取的特征并没有很大的差距，因此对结果影响并不大。

注意力机制

但是，针对ABM的注意力机制，还存在着一些不太完善的地方，从测试结果可以看出，有一部分测试集的一些符号出现了多次解码或干脆没有解码。于是我计划对比测试结果与真是结果之间的差距，对测试结果进行统一分析，同时对提取那些因为注意力机制解码错误图片的特征，分析并改进注意力机制。

树形解码器

treeDecder相比于stringDecoder，具有的明显优势就是对结构的泛化能力更好。属性解码器构建一个树形结构，其中节点就是那些需要识别的符号，而边表示子节点与父节点的关系。此外，一个父节点可能有多个子节点，这不难理解，因为对于复杂的数学公式，一个符号必然有多种关系与之对应。这就避免不了按什么顺序构建树的问题。对于这一点，stringDecoder就只能按照预定的顺序进行解码，这样对数学公式结构的泛化能力并不好；而是用treeDecoder便可以打乱子节点的顺序，这样就增加了灵活性，如下图所示：
在这里插入图片描述
这里就明显看出了treeDecoder的优势所在，除此之外，对于复杂的嵌套结构，对于父节点与子节点的嵌套关系可以不断嵌套，从而形成较为简单的结构。由于treeDecoder内部结构较为复杂，后续我们将继续花更多的时间在treeDecoder的实现上面。