关于命名实体识别的方法对比总结与原理初探

本文深入探讨BERT模型,包括其双向Transformer编码、Masked LM、Transformer结构及Sentence-level处理。BERT利用Transformer的注意力机制捕捉词汇间的上下文关系,通过Masked LM增强句子特征,适用于NLP任务如命名实体识别。微调阶段,通过组合Masked LM和Next Sentence Prediction的损失函数进行优化。
摘要由CSDN通过智能技术生成
  主要作用 优点 缺点
BERT      
BILSTM      
BIGRU      

BERT中demo:如图两个句子的分类任务(MNLI\QQP\QNLI\STS-B\MRPC\RTE\SWAG),单句的分类任务(SST-2\CoLA);问答任务(SQuAD v1.1);单句序列标注任务(CoNLL-2003 NER),Google在很多任务上都做了测试,显示出了较好的性能。(预训练机制、微调机制??)

 

一、BERT 原理初探

原文下载地址:https://arxiv.org/pdf/1810.04805.pdf

参考阅读笔记:https://zhuanlan.zhihu.com/p/46652512https://www.jianshu.com/p/4cb1f255cd7chttps://www.cnblogs.com/rucwxb/p/10277217.html

  上下文相关 模型 预测目标 下游具体任务
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值