bert
文章平均质量分 94
one-莫烦
keep going
展开
-
详解transformer
1.Transformer 整体结构首先介绍 Transformer 的整体结构,下图是 Transformer 用于中英文翻译的整体结构:可以看到 Transformer 由 Encoder 和 Decoder 两个部分组成,Encoder 和 Decoder 都包含 6 个 block。Transformer 的工作流程大体如下:第一步:获取输入句子的每一个单词的表示向量 X,X由单词的 Embedding(Embedding就是从原始数据提取出来的Feature) 和单词位置的 Embeddi转载 2021-12-01 16:08:24 · 5543 阅读 · 1 评论 -
Bert一些重要函数的详解
记录一下embedding_lookup根据词的索引来获取embedding输入是[batch_size,seq_lenth] 输出[batch_size,seq_lenth,embeding_size]def embedding_lookup(input_ids, vocab_size, embedding_size=128, initializer_range=0.02原创 2021-11-26 14:32:31 · 1890 阅读 · 0 评论