X1是[batch_size,feature_size]
X2是[batch_size,feature_size]
X1*W1+X2*W2等价于[X1:X2]*W3
其中*是矩阵相乘,:是feature dimension concat
W1是[feature_size,feature_size2]
W2是[feature_size,feature_size2]
W3是[feature_size*2,feature_size2]
论文公式里的 加号 结合代码的一些常识
最新推荐文章于 2025-04-21 19:31:39 发布
