项目实训七

本文回顾了ScaleAugmentation在数学公式识别中的应用,发现模型对特征变化影响不大。着重讨论了注意力机制的问题,计划通过错误分析改进。同时,树形解码器(treeDecoder)的优越性在结构泛化方面得到强调,未来将重点优化其实现。
摘要由CSDN通过智能技术生成

Scale Augmentation

对于上周提出的Scale Augmentation思想,经过将近一个周的多次训练,测试结果吓显示模型并没有在2014年的测试集上正确率并没有提高,但是也没有降低,这说明经过规模扩充的数据集,经过DenseNet网络提取的特征并没有很大的差距,因此对结果影响并不大。

注意力机制

但是,针对ABM的注意力机制,还存在着一些不太完善的地方,从测试结果可以看出,有一部分测试集的一些符号出现了多次解码或干脆没有解码。于是我计划对比测试结果与真是结果之间的差距,对测试结果进行统一分析,同时对提取那些因为注意力机制解码错误图片的特征,分析并改进注意力机制。

树形解码器

treeDecder相比于stringDecoder,具有的明显优势就是对结构的泛化能力更好。属性解码器构建一个树形结构,其中节点就是那些需要识别的符号,而边表示子节点与父节点的关系。此外,一个父节点可能有多个子节点,这不难理解,因为对于复杂的数学公式,一个符号必然有多种关系与之对应。这就避免不了按什么顺序构建树的问题。对于这一点,stringDecoder就只能按照预定的顺序进行解码,这样对数学公式结构的泛化能力并不好;而是用treeDecoder便可以打乱子节点的顺序,这样就增加了灵活性,如下图所示:
在这里插入图片描述
这里就明显看出了treeDecoder的优势所在,除此之外,对于复杂的嵌套结构,对于父节点与子节点的嵌套关系可以不断嵌套,从而形成较为简单的结构。由于treeDecoder内部结构较为复杂,后续我们将继续花更多的时间在treeDecoder的实现上面。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值