一篇论文引发的讨论:
Q:Transformer Layer 和Transformer Block是什么意思?
A: Transformer Layer表示Transformer层,Transformer Block表示Transformer块。
Q:我不是来学英语的,Transformer Layer 和Transformer Block是什么,有什么区别,这张网络图里的哪个部分是Transformer Layer 和Transformer Block?
A: 每个Encoder Block就是一个Transformer block,4个Encoder block 组成一个Transformer Layer。(按照block和layer一样的说法,这里没毛病吧,一百个人一百个哈姆雷特?)
Q:你确定吗?嗯?
A: 没问题啊。
Q:再给你一次机会,Transformer Layer 和Transformer Block是什么,有什么区别?
A: 静默-我搜一下。
Q:别搜了,你看群里我发的图,再解释一下,到底什么是Transformer Layer ,什么是Transformer Block,有什么区别?
A:Transformer block就是由自注意力、LN、多层感知器、LN组成;Transformer Layer就是这些block的组合?
Q:你确定?
A:Transformer block和Transformer Layer本来就一个概念。
Q:是吧,Transformer block和Transformer Layer没有区别。我看你对Transformer的理解都一团糊浆了。
A:(静默-我???)那我不管说Transformer block还是Transformer Layer都没有问题啊?
Q:你根本就没有理解Transformer。
A:(静默-我???那我不说了)那您觉得Transformer block和Transformer Layer的区别在哪里?
Q:Transformer block和Transformer Layer是一个概念,只不过在内部操作的时候,我们会把这个叫做Transformer block,在外部操作时,我们称之为Transformer Layer,因为外部来看是多层感知器,以层称呼。
OS:这是约定俗成,还是官方文件?我不理解,直接说出来不好吗?我怎么会知道这么细呢?我不理解,看来我还菜…?
弄懂Transformer Layer 和Transformer Block的关系后,豁然开朗
最新推荐文章于 2024-05-16 20:45:19 发布