菜鸡笔记,不喜莫喷
现在有一个完整的Transformer模型,但是我只想分析它Layer Normalization的参数;其他 1 0 8 10^8 108左右的参数我不想看,看到就头大。已知这部分参数的名字大概有如下的pattern
layer_prepostp
TensorFlow奇技淫巧之快速读模型的部分参数
最新推荐文章于 2022-04-21 23:48:48 发布
![](https://img-home.csdnimg.cn/images/20240711042549.png)
菜鸡笔记,不喜莫喷
现在有一个完整的Transformer模型,但是我只想分析它Layer Normalization的参数;其他 1 0 8 10^8 108左右的参数我不想看,看到就头大。已知这部分参数的名字大概有如下的pattern
layer_prepostp