下图清晰了显示了PCNN的整个网络架构,PCNN的实现过程:
- 数据预处理:首先对数据进行位置编码,按句子中各个词离entity的距离进行编码。
例如:“As we known,Steve Jobs was the co-founder of Apple Inc which is a great company in America.”
由于句子中有两个entity,所以这条句子就会产生两个和句子长度相同的编码。
pos_1:[-4,-3,-2,-1,0,1,2,3......] ,其中0就是Steve Jobs的位置。
pos_2:[-9,-8,-7,-6,-5,-4,-3,-2,-1,0,1,2,3......] 其中0就是Apple Inc的位置。
- 切分句子:其中最主要的就是将一条文本数据在两个entity处各切一刀将文本且成了3段。(注意,位置向量也同样进行了切分操作)
比如 A