带自注意力的命名实体识别迁移学习

最新推荐文章于 2023-01-22 01:44:11 发布

SYSU_BOND

最新推荐文章于 2023-01-22 01:44:11 发布

阅读量801

点赞数

分类专栏：实体识别论文阅读文章标签： NER 实体识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SYSU_BOND/article/details/117351913

版权

论文阅读同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

5 篇文章 1 订阅

订阅专栏

Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism

论文要点

这篇本质是迁移学习的文章，将CWS任务数据迁移到NER任务上；而使用对抗迁移学习的框架，在利用共享任务中的边界信息的同时，过滤分词任务的特有信息以免干扰NER任务【数据分布，分词粒度不一等】，对抗迁移学习是将对抗学习合并到迁移学习中。引入对抗学习保证CWS只利用task-shared词边界信息：

模型框架

以char生成emb，虽然图中NER和CWS的emb画为两部分，不过这个应该是共享的
NER和CWS任务各有一个share和private的特征抽取器，为BiLSTM，share的特征抽取器即为提取任务共享边界信息
使用multi head Self-Attention获取全局结构信息，将share和private结果拼接输入到CRF，计算NER和CWS任务的loss
share层特征参与对抗学习，判断输入句子来自哪个任务数据集，其中梯度有个【Gradient Reversal】目的是希望共享结构不会包含任务信息的判断，不直接取反，是因为，二分类Loss取反时，还是能够起到分类作用的
最后训练用的Loss：

模型效果

模型效果：CSW任务使用MSR数据集

各部分组件效果对比：

模型缺点

核心创新在于引入对抗训练，不过这个对抗训练的Loss效果存疑，仅在两个小规模数据集验证

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

SYSU_BOND CSDN认证博客专家 CSDN认证企业博客

码龄10年

44: 原创

8万+: 周排名

142万+: 总排名

9万+: 访问

: 等级

1174: 积分

10: 粉丝

64: 获赞

17: 评论

212: 收藏

私信

关注

分类专栏

最新评论

中文实体识别数据集
Mr-Apple: links https://github.com/jiesutd/LatticeLSTM/blob/master/data/demo.dev.char demo.dev.char文件中的标签 PER ORG GPE LOC
中文实体识别数据集
Mr-Apple: links https://github.com/hltcoe/golden-horse/blob/master/data/weiboNER_2nd_conll.dev 文件weiboNER.conll,,weiboNER_2nd_conl中的标签 PER.NAM GPE.NAM LOC.NOM ORG.NOM
中文词性标注数据集
tndic: 你好，请问你获得了相关的数据集了吗，可以分享一份吗，非常感谢。
中文词性标注数据集
Chainszz: 您好，请问您有相关的数据集吗，可以分享一份吗，非常感谢。
最好的正则表达式学习整理
CSDN-Ada助手: 你的文章质量不错，值得学习！但还有一点小瑕疵，具体如下：(1)使用更多的站内链接；(2)使用标准目录。

大家在看

【教程4＞第3章＞第12节】16PSK调制系统的FPGA开发与matlab验证

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。