bert pytorch 序列标注_(四)序列标注——实体识别BERT-BLSTM-CRF(下)

本文介绍了BERT模型在命名实体识别(NER)任务中的应用,使用BERT+BILSTM-CRF框架。内容包括数据准备、模型构建、预训练参数加载和优化器定义,展示了如何在PyTorch中实现这一过程,并分享了实验结果。
摘要由CSDN通过智能技术生成

前面说的是ner的经典算法以及今年的一些比较好的工作,最近bert模型刷新了NLP的绝大部分任务,可谓是一夜之间火爆了整个NLP界,这里我简单记录下bert在NER上的使用,至于原理部分我后续的博客会做详细的说明。这里先暂时理解成bert同样也是产生embedding的工具就可以,只不过这个embedding比Word2vec的embedding要厉害。

ok 我们先设定下框架。

框架很简单,就是bert+Bilstm-CRF,前面讲了bert就是用来产生词向量的,所以如果抛开这个原理,这个升级版本的NER模型就很简单了。

这里先给出代码链接。BERT是Google提出的基于tensorflow1.11.0的代码,里面用了高级API,所以这篇博客我主要在代码层面讲一下bert的应用。原理部分我也做了详细的介绍,请戳。

bert官方版本的代码写的非常好(虽然很难懂哈),这里借NER这个应用简单学习下:

1.数据准备

这里还是以中文数据为例,数据的格式还是和之前一样:

我们最终需要把数据转换成bert论文中的形式:

代码中的数据就是转成这样,这部分是纯工程问题,就不详细介绍    :

接下来就讲一下这个高级API的用法:

1.代码中将所有数据封装成record的形式:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值