一、Bilinear model 解析
bilinear model是一种将多个特征结合起来作为input的方法。
比如:对于一个词,他的特征就包括:词性特征,word embedding特征etc. 如果结合多source的特征,就加入了更多信息,实现更有效的表征。
最简单的做法是:
(1)直接拼接两个特征: [f1:f2]
(2)线性组合: F=W1f1+W2f2
bilinear model 实现了特征的多通道输入。
我们可以设想,人脑可能有一个通道专门处理位置信息,有另一个通道专门处理色彩信息。
通俗一点讲,bilinear 就是对每个位置上的特征进行矩阵相乘,然后进行 sum-pooling
或者进行 max-pooling
。
对于一个 CNN 来讲,有个c
通道数,那么在位置i
上的特征就是的1xc
大小,然后与同一位置上,不同CNN得到的1xc
的矩阵进行乘积,得到cxc</