360：通过分层细节网络增强复杂公式识别

大模型任我行

于 2024-10-03 10:00:00 发布

阅读量1k

点赞数 20

分类专栏：大模型-模型训练文章标签：人工智能自然语言处理语言模型论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46739757/article/details/142655729

版权

在这里插入图片描述

📖标题：Enhancing Complex Formula Recognition with Hierarchical Detail-Focused Network
🌐来源：arXiv, 2409.11677

摘要

🔸由于公式的多种可能解释，分层和复杂的数学表达式识别（MER）具有挑战性，使解析和计算都变得复杂。
🔸在本文中，我们介绍了分层细节聚焦识别数据集（HDR），这是第一个专门为解决这些问题而设计的数据集。它由一个大规模的训练集HDR-100M组成，提供了前所未有的规模和多样性，有一亿个训练实例。测试集HDR测试包括对复杂层次公式的多种解释，用于综合模型性能评估。
🔸此外，解析复杂公式时经常会出现细粒度细节错误。为了解决这个问题，我们提出了分层细节聚焦识别网络（HDNet），这是一个创新的框架，它包含了一个分层子公式模块，专注于精确处理公式细节，从而显著提高了MER性能。实验结果表明，HDNet在各种数据集上的表现优于现有的MER模型。

🛎️文章简介

🔸研究问题：现有模型在处理复杂结构、重叠符号或低质量图像的公式时，容易出现解析错误。
🔸主要贡献：论

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大模型任我行 随意啦，喜欢就好~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。