nlp学习10

最新推荐文章于 2024-07-11 11:15:46 发布

weixin_38745403

最新推荐文章于 2024-07-11 11:15:46 发布

阅读量91

点赞数

分类专栏：学习

本文链接：https://blog.csdn.net/weixin_38745403/article/details/96434593

版权

学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

BERT

Transformer的原理

Transformer是一种完全基于Attention机制来加速深度学习训练过程的算法模型。Transformer最大的优势在于其在并行化处理上做出的贡献。
Transformer抛弃了以往深度学习任务里面使用到的 CNN 和 RNN ，目前大热的Bert就是基于Transformer构建的，这个模型广泛应用于NLP领域，例如机器翻译，问答系统，文本摘要和语音识别等等方向。
参考论文：Attention Is All You Need：https://arxiv.org/abs/1706.03762

BERT的原理

BERT模型的全称是Bidirectional Encoder Representations from Transformers，它是一种新型的语言模型。之所以说是一种新型的语言模型，是因为它通过联合调节所有层中的双向Transformer来训练预训练深度双向表示。
想深入了解BERT模型，首先应该理解语言模型。预训练的语言模型对于众多自然语言处理问题起到了重要作用，比如SQuAD问答任务、命名实体识别以及情感识别。目前将预训练的语言模型应用到NLP任务主要有两种策略，一种是基于特征的语言模型，如ELMo模型；另一种是基于微调的语言模型，如OpenAI GPT。这两类语言模型各有其优缺点，而BERT的出现，似乎融合了它们所有的优点，因此才可以在诸多后续特定任务上取得最优的效果。

利用预训练的BERT模型将句子转换为句向量，进行文本分类

BERT 可以用于各种NLP任务，只需在核心模型中添加一个层，例如：
1.在分类任务中，例如情感分析等，只需要在 Transformer 的输出之上加一个分类层
2 在问答任务（例如SQUAD v1.1）中，问答系统需要接收有关文本序列的 question，并且需要在序列中标记 answer。可以使用 BERT 学习两个标记 answer 开始和结尾的向量来训练Q＆A模型。
3.在命名实体识别（NER）中，系统需要接收文本序列，标记文本中的各种类型的实体（人员，组织，日期等）。可以用 BERT 将每个 token 的输出向量送到预测 NER 标签的分类层。
使用BERT对新浪新闻cnews进行文本分类：
代码参考：https://blog.csdn.net/yyy430/article/details/88682656

weixin_38745403

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
nlp学习10

BERTTransformer的原理Transformer是一种完全基于Attention机制来加速深度学习训练过程的算法模型。Transformer最大的优势在于其在并行化处理上做出的贡献。Transformer抛弃了以往深度学习任务里面使用到的 CNN 和 RNN ，目前大热的Bert就是基于Transformer构建的，这个模型广泛应用于NLP领域，例如机器翻译，问答系统，文本摘要和语...
复制链接

扫一扫