fewshot_NER:SpanProto: A Two-stage Span-based Prototypical Network for Few-shot Named Entity Recogni

最新推荐文章于 2023-10-14 15:41:37 发布

YingJingh

最新推荐文章于 2023-10-14 15:41:37 发布

阅读量446

点赞数 1

分类专栏： EMNLP 文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hekena/article/details/128120035

版权

EMNLP 专栏收录该内容

18 篇文章 2 订阅

订阅专栏

Introduction

我们提出了一个开创性的基于跨度的原型网络（SpanProto），它通过一个两阶段的方法来解决少量的NER问题，包括跨度提取和提及分类。在跨度提取阶段，我们将顺序标签转化为全局边界矩阵，使模型能够专注于明确的边界信息。对于提及分类，我们利用原型学习来捕捉每个标记的跨度的语义表示，并使模型更好地适应小说类实体。

模型分为两个部分，通过表填充方式解决mention识别问题，使用原型网络解决mention分类问题。

Model

在这里插入图片描述
第一部分：mention识别是通过pointer network解决的。损失函数时二分类交叉熵损失函数。

第二部分：原型学习实现关系分类。在每一个episode中，通过平均化相同实体类型的span的表示得到对应class的原型。损失函数是分类损失函数。

当识别出的flase positive类型，则将the false positive can be viewed as a special entity mention, which has no type to be assigned in Ttrain, but could be an entity in other
episode data. In other words, the real type of this
false positive is unknown. Thus, a natural idea is
that we can keep it away from all current prototypes
in the semantic space. S
在这里插入图片描述

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
fewshot_NER:SpanProto: A Two-stage Span-based Prototypical Network for Few-shot Named Entity Recogni

我们提出了一个开创性的基于跨度的原型网络（SpanProto），它通过一个两阶段的方法来解决少量的NER问题，包括。在跨度提取阶段，我们将顺序标签转化为全局边界矩阵，使模型能够专注于明确的边界信息。对于提及分类，我们利用原型学习来捕捉每个标记的跨度的语义表示，并使模型更好地适应小说类实体。模型分为两个部分，通过表填充方式解决mention识别问题，使用原型网络解决mention分类问题。
复制链接

扫一扫

专栏目录

YingJingh CSDN认证博客专家 CSDN认证企业博客

码龄4年

343: 原创

2万+: 周排名

7433: 总排名

25万+: 访问

: 等级

4108: 积分

1978: 粉丝

211: 获赞

49: 评论

680: 收藏

私信

关注

热门文章

分类专栏

最新评论

word中避免无引用源的方法
hx0520: 摸索了一下mac系统锁定域,按command+fn+f11
PDF相关的处理操作
haakaa: csdn这段确实好用
EMNLP-21-Enhanced Language Representation with Label Knowledge for Span Extraction-NER-融入label knowl
小阳不一样666666: 请问作者你复现成功了嘛？我按照论文设置超参数，但是对于ace2005效果只有0.84没有论文的0.86，这是我设置的情况：--task_type=ner --task_save_name=ner111 --data_dir=./data/ace2005 --data_name=ace2005 --model_name_or_path=D:/YangCode/data/bert-large-cased --model_name=SERS --output_dir=./outmodel --result_dir=./result --do_lower_case=False --first_label_file=./data/ace2005/processed/label_map.json --train_set=./data/ace2005/processed/train.json --dev_set=./data/ace2005/processed/dev.json --test_set=./data/ace2005/processed/test.json --label_str_file=./data/ace2005/processed/label_annotation.txt --overwrite_output_dir=True --exist_nested=True --do_train=True --is_chinese=False --val_step=20 --use_attn=True --seed=42 --max_seq_length=128 --dropout_rate=0.1 --learning_rate=3e-5 --task_layer_lr=2 --num_train_epochs=20能帮忙看看问题所在嘛？
EMNLP-21-Enhanced Language Representation with Label Knowledge for Span Extraction-NER-融入label knowl
YingJingh: 那得看你的环境和论文中的环境一不一致
EMNLP-21-Enhanced Language Representation with Label Knowledge for Span Extraction-NER-融入label knowl
小阳不一样666666: 你好，请问这个代码你运行起来了嘛？能咨询你一下嘛？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

YingJingh 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。