nlp 中文文本纠错_NLP中文文本分类任务的笔记（三）

最新推荐文章于 2024-01-18 02:07:52 发布

爱小宝要久久

最新推荐文章于 2024-01-18 02:07:52 发布

阅读量160

点赞数

文章标签： nlp 中文文本纠错

本文链接：https://blog.csdn.net/weixin_28718345/article/details/112157886

版权

承接前两篇笔记

邓文涛：NLP中文文本分类任务的笔记（一）zhuanlan.zhihu.com

邓文涛：NLP中文文本分类任务的笔记（二）zhuanlan.zhihu.com

这篇主要想讲一讲对transformer和BERT框架的一些个人理解。关于细节一些可以参考知乎大神们的一些文章：

先上图

在初始化

的时候，我们先需要经过一个线性变换：

2. 接下来经过Multi-Head Attention对positional encoding 进行学习：

可以知道，attention用的正是上一篇笔记中使用的self-attention结构，其实也就是 Scaled Dot-Product Attention。

Muti-Head 的意思是通过初始化多个self-attention的结构，默认的一些参数分别是：

, 因此我们可以将对应的attention公式改成如何的操作：

接下来将8个head的attention拼在一起，进过一个dense layer进行整合。

3. 第三部分其实是一个 position-wise feed-forward network，其实就是一个全联接层。

关注