![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP论文时报
文章平均质量分 91
NLP论文时报
小小帅AIGC
这个作者很懒,什么都没留下…
展开
-
AI推介-信息抽取(information extraction,NER)论文速览(arXiv方向):2023.08.01-2024.10.15
几个世纪以来,新材料的发现推动了人类的进步。材料的性能是其组成、结构和特性的函数,而这些又进一步取决于其加工和测试条件。深度学习和自然语言处理领域的最新发展,使得从同行评议出版物、书籍和专利等已出版文献中大规模提取信息成为可能。然而,这些信息以表格、文本和图像等多种格式传播,报告风格几乎没有统一性,这给机器学习带来了一些挑战。在此,我们讨论、量化并记录了从材料科学文献中进行自动信息提取(IE)以创建大型材料科学知识库所面临的挑战。具体来说,我们重点关注从文本和表格中进行信息提取,并通过实例概述了几项挑战。原创 2024-07-01 13:34:44 · 1063 阅读 · 0 评论 -
AI推介-信息抽取(information extraction,NER)论文速览(arXiv方向):2023.10.15-2023.11.15
命名实体识别(NER)在各种自然语言处理(NLP)应用中至关重要。传统的 NER 模型虽然有效,但仅限于一组预定义的实体类型。相比之下,大型语言模型(LLM)可以通过自然语言指令提取任意实体,具有更大的灵活性。然而,它们的规模和成本,尤其是通过像 ChatGPT 这样的应用程序接口进行访问时的规模和成本,使它们在资源有限的情况下变得不切实际。在本文中,我们介绍了一种经过训练的紧凑型 NER 模型,可以识别任何类型的实体。原创 2024-06-28 20:50:19 · 1055 阅读 · 0 评论 -
AI推介-信息抽取(information extraction,NER)论文速览(arXiv方向):2023.11.15-2023.12.31
信息提取(IE)旨在从简单的自然语言文本中提取结构性知识(如实体、关系和事件)。最近,生成式大语言模型(LLMs)在文本理解和生成方面表现出了非凡的能力,可以在各种领域和任务中通用。因此,人们提出了许多利用 LLM 能力的方法,并基于生成范式为 IE 任务提供可行的解决方案。为了全面系统地回顾和探讨 LLM 在 IE 任务方面所做的努力,我们在本研究中调查了该领域的最新进展。首先,我们根据不同的 IE 子任务和学习范式对这些工作进行了分类,从而对其进行了广泛的概述;原创 2024-06-28 20:50:03 · 902 阅读 · 0 评论 -
AI推介-信息抽取(information extraction,IE)论文速览(arXiv方向):2024.04.15-2024.06.01
在快速发展的医疗保健及其他领域,将生成式人工智能集成到电子健康记录(EHR)中代表了一项关键的进步,解决了当前信息提取技术中的一个关键缺口。本文介绍了 GAMedX,这是一种命名实体识别(NER)方法,利用大语言模型(LLMs)从患者在医院就诊的各个阶段产生的医疗叙述和非结构化文本中有效地提取实体。通过应对处理非结构化医疗文本的重大挑战,GAMedX 利用生成式人工智能和大型语言模型的功能改进了数据提取。原创 2024-06-27 10:11:25 · 1066 阅读 · 0 评论 -
AI推介-信息抽取(information extraction,NER)论文速览(arXiv方向):2024.02.15-2024.04.15
近年来,在命名实体识别(NER)任务中,微调生成模型已被证明比以前基于标记或跨度的模型更强大。研究还发现,与实体相关的信息(如实体类型)能促使模型更好地实现 NER。然而,要事先确定给定句子中确实存在的实体类型并不容易,而且输入过多的潜在实体类型难免会分散模型的注意力。为了发挥实体类型在促进 NER 任务方面的优势,本文提出了一种新颖的 NER 框架,即基于生成模型的 ToNER。在 ToNER 中,我们首先提出了一个类型匹配模型来识别句子中最有可能出现的实体类型。原创 2024-06-27 10:11:07 · 737 阅读 · 0 评论 -
AI推介-信息抽取(information extraction,NER)论文速览(arXiv方向):2024.01.01-2024.02.15
预训练的大型语言模型为许多应用带来了革命性的变化,但仍然面临着与文化偏见有关的挑战,以及缺乏对指导跨文化交流和互动至关重要的文化常识性知识。认识到现有方法在捕捉全球丰富多样的文化方面存在不足,本文介绍了一种大规模多元文化知识获取的新方法。具体来说,我们的方法从信息密集的维基百科文化主题文档到广泛的链接页面网络进行战略性导航。原创 2024-06-27 10:10:55 · 718 阅读 · 0 评论 -
AI推介-信息抽取(information extraction,NER)论文速览(arXiv方向):2024.06.01-2024.06.20
标题:ABEX:通过扩展抽象描述为低资源 NLU 扩充数据摘要我们介绍的 ABEX 是一种用于低资源自然语言理解(NLU)任务的新颖而有效的生成数据增强方法。ABEX 基于 ABstract-and-EXpand 方法,这是一种生成输入文档的多种形式的新模式–我们首先将文档转换为简洁的抽象描述,然后在扩展抽象描述的基础上生成新文档。为了学习扩展抽象描述的任务,我们首先在一个包含抽象文档对的大规模合成数据集上训练 BART。原创 2024-06-26 12:41:14 · 621 阅读 · 0 评论