简介
使用Keras实现Siamese Network并进行语句相似度的计算
原理
Siamese Network是指网络中包含两个或以上完全相同的子网络,多应用于语句相似度计算、人脸匹配、签名鉴别等任务上
- 语句相似度计算:输入两句话,判断是否是一个意思
- 人脸匹配:输入两张人脸,判断是否是同一个人
- 签名鉴别:输入两个签名,判断是否是同一个人所写
以语句相似度计算为例,两边的子网络从Embedding层到LSTM层等都是完全相同的,整个模型称作MaLSTM(Manhattan LSTM)
通过LSTM层的最后输出得到两句话的固定长度表示,再使用以下公式计算两者的相似度,相似度在0至1之间
D = exp ( − ∥ h ( l e f t ) − h ( r i g h t ) ∥ 1 ) D=\exp{(-\left\| h^{(left)}-h^{(right)} \right\|_1)} D=exp(−∥∥∥h(left)