抛弃模板的Promot Learning用于NER任务

最新推荐文章于 2023-05-30 18:20:06 发布

Dongxue_NLP

最新推荐文章于 2023-05-30 18:20:06 发布

阅读量498

点赞数 1

分类专栏：自然语言处理NLP 文章标签：深度学习人工智能自然语言处理神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dongxueb/article/details/126159006

版权

01 前言

1.论文的相关背景

Prompt Learning通过设计一组合适的prompt将下游任务的输入输出形式重构成预训练任务中的形式，充分利用预训练阶段学习的信息，减少训练模型对大规模标注数据集的需求。

例如对于用户评论的情感分析任务：判断用户评论的“交通太不方便了。”这句话蕴含的情感是“正面”还是“负面”。原有的处理范式是将其建模成一个文本分类问题，输入“交通太不方便了。”，输出“正面”或者 “负面”。

但如果使用Prompt Learning范式，则会将输入重构成“交通太不方便了。感觉很“[MASK]”，输出“好”或者“差”。

Prompt Learning借助合适的prompt减少了预训练和微调之间的差异，进而使得模型在少量的样本上进行微调，即可取得不错的效果，因此受到大量专家学者的关注，被誉为自然语言处理的第四范式。

命名实体识别是指识别文本中具有特定意义的实体，主要包括人名、地名、机构名、专有名词等。

目前基于深度学习的命名实体识别方法已经取得了较高的识别精度，但由于深度学习模型依赖于大量的标注语料，因此在缺少大规模标注数据的垂直领域很难取得较好的效果。

针对少样本命名实体识别问题，常规的方案是基于相似性的度量方法，但该方法无法利用模型参数中的知识进行迁移。

为了解决该问题，如下图所示的TemplateNER引入Prompt Learning通过人工设计的实体模板（<候选实体> is a <实体类型> entity）和非实体模板（<候选实体> is not a named entity）将命名实体识别问题建模成seq2seq框架下的语言模型打分任务，具体过程如下图所示。

TemplateNER在跨域和少样本场景下显著优于传统的序列标记方法和基于距离的少样本NER方法，但TemplateNER在生成候选实体时需要使用n-grams方法进行枚举，因此存在严重的效率问题。

2. 论文主要解决的问题

TemplateNER等基于Prompt Learning命名实体识别模型在识别效率上的问题

3. 论文的主要创新和贡献

● 提出了一种少样本场景下无模板的基于Prompt Learning的命名实体识别算法

● 舍弃了使用n-grams方法生成候选实体的

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Dongxue_NLP CSDN认证博客专家 CSDN认证企业博客

码龄3年

30: 原创

10万+: 周排名

138万+: 总排名

7万+: 访问

: 等级

433: 积分

52: 粉丝

99: 获赞

26: 评论

755: 收藏

私信

关注

热门文章

分类专栏

最新评论

Seq2Seq+Attention生成式文本摘要
m0_62786621: from datasets import load_dataset dataset = load_dataset("gigaword")
基于医疗知识图谱的问答系统运行步骤-注意事项
不会代码的Andy: 你好，楼主我运行的这时候还总是显示和编码有关的错误，我的json文档下面全是红色下划线，改成数组格式之后又会显示读取不到数据。你当时改json文件了吗
Flat-Lattice-Transformer模型源码测试
乘续缘: 请问这个F1是Span的F1值还是和其他模型作对比的F1值吖
Flat-Lattice-Transformer模型源码测试
ZC_929: 你好，请问你在使用weibo数据集时，有没有遇到这个问题ModuleNotFoundError: No module named 'const'
Seq2Seq+Attention生成式文本摘要
RRRuIII: 你好，请问能分享一下模型吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。