命名实体识别任务中BERT预训练模型的使用

奶油泡芙shi_caicai

已于 2023-04-18 19:44:08 修改

阅读量576

点赞数 2

分类专栏：自然语言处理文章标签： bert 深度学习自然语言处理

于 2023-04-18 18:26:49 首次发布

本文链接：https://blog.csdn.net/weixin_59191887/article/details/130227943

版权

自然语言处理专栏收录该内容

3 篇文章

订阅专栏

BERT模型的输入由字向量、句向量和位置向量叠加生成，BERT模型通过查询字向量表将中文序列中的字符转换为字向量表示，句子向量用于区分不同的句子，位置向量用于区分句子中不同位置的字符，将三者拼接之后输入transformer中提取文本特征，最终的输出向量作为字符特征向量。以“［ＣＬＳ］头晕［ＳＥＰ］脑梗死［ＳＥＰ］”为例，用［ＣＬＳ］标识句子的开始位置，用［ＳＥＰ］标识句子的结束位置，Ｅ表示向量表达，Ｔｒｍ表示transformer模型。
在这里插入图片描述
BERT模型详解1
BERT模型详解2

预训练阶段根据数据集处理得到BERT模型的输入向量—字向量、句向量和位置向量
使用网上下载的BERT预训练模型，比如bert-base-chinese
一：可以对其进行参数微调以适应特定的下游任务。在命名实体识别任务中，需要将BERT模型与BiLSTM和CRF结合起来进行训练，通过反向传播算法优化模型参数，以提高模型在命名实体识别任务上的表现。
二：固定参数，经过BERT得到词向量。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。