![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文阅读
文章平均质量分 94
m0_54237635
这个作者很懒,什么都没留下…
展开
-
应用中学习:通过加强显性知识学习的数学推理的一般框架
数学推理是通用人工智能的关键能力之一,它要求机器从解决问题中掌握数学逻辑和知识。然而,就在推理过程中学习和应用了哪些知识而言,现有方法并不透明(因此不可解释)。在本文中,我们提出了一个通用的学习应用(LeAp)框架,通过显性知识学习以原则性的方式增强现有模型(backbone)。在LeAp中,我们以一种新的问题-知识-表达范式进行知识学习,知识编码器从问题数据中获取知识,知识解码器将知识应用于表达推理。原创 2024-04-05 22:37:11 · 841 阅读 · 1 评论 -
UReader:基于多模态大型语言模型的通用无ocr视觉情境语言理解
论文:《UReader: Universal OCR-free Visually-situated Language Understanding with Multimodal Large Language Model》论文地址:https://arxiv.org/abs/2310.05126代码地址:https://github.com/LukeForeverYoung/UReader.摘要文本在我们的视觉世界中无处不在,传递着重要的信息,如文档、网站和日常照片。原创 2023-12-17 13:59:21 · 1516 阅读 · 1 评论 -
mPLUG: Effective and Efficient Vision-Language Learning by Cross-modal Skip-connections
大规模预训练的基础模型已经成为构建人工智能(AI)系统的新兴范式,可以快速适应各种下游任务。本文介绍了mPLUG,一个新的用于跨模态理解和生成的视觉语言基础模型。现有的预训练模型存在计算效率低和跨模态对齐中长视觉序列带来的信息不对称问题。为了解决这些问题,mPLUG引入了一种有效且高效的视觉语言架构,该架构具有新颖的跨模态跳过连接,创建了层间快捷方式,可以跳过一定数量的层,以便在视觉方面进行耗时的完全自注意力。mPLUG是在具有区分性和生成性目标的大规模图文对上进行端到端预训练。原创 2023-12-21 16:43:27 · 1141 阅读 · 2 评论 -
具有结构规划和知识增强的数学单词问题生成器
自动生成可控的、多样的、符合方程和主题的数学应用题是信息检索和自然语言生成中的一个重要任务。最近的深度学习模型主要关注提高问题的可读性,但忽略了数学逻辑的连贯性,这往往会产生无法解决的问题。本文从人类的问题设计过程中得到启发,提出了一个数学结构规划和知识增强生成模型(MaPKG),遵循“规划-生成”的步骤。具体来说,我们提出了一种新的动态规划模块,使双级方程计划和双注意机制的字级生成,将方程结构表示和外部常识知识。在两个MWP数据集上的广泛实验表明,该模型可以保证更多可解决的、高质量的和多样化的问题。原创 2023-12-14 16:43:02 · 1021 阅读 · 1 评论