本片论文出自(ACL 2018)
从以下几个方面展开:
1.论文目的
2.论文创新点
3.模型框架
1.论文目的
正如文章介绍的那样,本篇论文解决的是针对某种电商产品,用户可能会对商品的各个属性有疑问,如果匹配用户的自然语言问题和商品的某个属性名称来得到最后的属性值是本篇文章需要解决的问题
2.论文创新点
(1)一个新而简单的神经网络
a.个人理解新体现在作者在做语义匹配时不是通过简单的共享训练的网络参数(孪生网络)和深层语义向量直接匹配的方式,而是通过分别训练问题和说明(Specification)各个的网络参数并且在语义特征提取完分别通过 absolute difference 和 element-wise来做特征
b.简答体现在整个网络结构中只有embedding和分别的bi-lstm特征提取,以及最后的Full connection layer,告别以前复杂的什么cnn-rnn-attention等堆叠公式
(2)一个全新的收集训练数据和评估的方法
3.模型框架
(1)word embedding:左边是问题的word embedding,右边是说明的word embedding,文中介绍是经过pre-train(word2vec or glove)
(2) bilstm: 没啥,只是跟传统NLP用attention来得到语义向量不一致的是这里用max-pooling来得到
(3)特征提取,分别通过 absolute difference 和 element wise 来得到向量
(4)FCL and softmax 没啥说的