bert pytorch 序列标注_（四）序列标注——实体识别BERT-BLSTM-CRF（下）

最新推荐文章于 2024-07-06 03:16:51 发布

weixin_39989980

最新推荐文章于 2024-07-06 03:16:51 发布

阅读量962

点赞数

文章标签： bert pytorch 序列标注

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39989980/article/details/111489297

版权

本文介绍了BERT模型在命名实体识别（NER）任务中的应用，使用BERT+BILSTM-CRF框架。内容包括数据准备、模型构建、预训练参数加载和优化器定义，展示了如何在PyTorch中实现这一过程，并分享了实验结果。

摘要由CSDN通过智能技术生成

前面说的是ner的经典算法以及今年的一些比较好的工作，最近bert模型刷新了NLP的绝大部分任务，可谓是一夜之间火爆了整个NLP界，这里我简单记录下bert在NER上的使用，至于原理部分我后续的博客会做详细的说明。这里先暂时理解成bert同样也是产生embedding的工具就可以，只不过这个embedding比Word2vec的embedding要厉害。

ok 我们先设定下框架。

框架很简单，就是bert+Bilstm-CRF,前面讲了bert就是用来产生词向量的，所以如果抛开这个原理，这个升级版本的NER模型就很简单了。

这里先给出代码链接。BERT是Google提出的基于tensorflow1.11.0的代码，里面用了高级API，所以这篇博客我主要在代码层面讲一下bert的应用。原理部分我也做了详细的介绍，请戳。

bert官方版本的代码写的非常好(虽然很难懂哈)，这里借NER这个应用简单学习下：

1.数据准备

这里还是以中文数据为例，数据的格式还是和之前一样：

我们最终需要把数据转换成bert论文中的形式：

代码中的数据就是转成这样，这部分是纯工程问题，就不详细介绍：

接下来就讲一下这个高级API的用法：

1.代码中将所有数据封装成record的形式：

最低0.47元/天解锁文章

weixin_39989980

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
bert pytorch 序列标注_（四）序列标注——实体识别BERT-BLSTM-CRF（下）

前面说的是ner的经典算法以及今年的一些比较好的工作，最近bert模型刷新了NLP的绝大部分任务，可谓是一夜之间火爆了整个NLP界，这里我简单记录下bert在NER上的使用，至于原理部分我后续的博客会做详细的说明。这里先暂时理解成bert同样也是产生embedding的工具就可以，只不过这个embedding比Word2vec的embedding要厉害。ok 我们先设定下框架。框架很简单，就是be...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。