PCNN模型解读：《Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks》

最新推荐文章于 2022-09-21 12:15:54 发布

Chloe Chiu

最新推荐文章于 2022-09-21 12:15:54 发布

阅读量1.3k

点赞数

分类专栏： NLP 文章标签：人工智能机器学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43496336/article/details/114004745

版权

本文解析Zeng等人的论文《Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks》，探讨Multi-instance问题及PCNN模型。PCNN通过piecewise卷积处理文本，训练时采用bag-level损失函数，预测时若至少一个instance为正则标签为正。

摘要由CSDN通过智能技术生成

PCNN模型解读

本文是对Daojian Zeng, Kang Liu, Yubo Chen and Jun Zhao的论文《Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks》的简要解读。

Multi-instance problem

训练样本：bag

bag：由多个instance组成，普通的训练任务中训练样本就是instance
bag有label，这个label是对于整个bag的概念，而bag中instance的label是未知的

目的：找到bag和instance之间的逻辑关系，从而能够对一个新bag预测其整体label

常见loss function设计：对bag中所有instance做平均池化 / 最大池化 / attention机制，进而得到对bag整体的预测

预测方法：分training和evaluation时的不同情况，有bag-level的，也有instance-level的

PCNN

model

model architecture：
PCNN model
quintuple：

$E$ : word embeddings
$PF_1, PF_2$ : position embeddings 1, 2
$W$ : convolution filter matrix
$W_1$ : linear transformation matrix (=> get n₁ relation scores)

MIL :

输入 - $T$ bags $\left \{ M_1, M_2, \dots, M_T \right \}$

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。