来源 | CSDN 博客
作者 | Matt_sh,责编 | Carol
出品 | CSDN云计算(ID:CSDNcloud)
本文是个人阅读文章的笔记整理,没有涉及到深度学习在关系抽取中的应用。
笔记中一部分来自个人解读,一部分来自原文,一部分来自网上摘录。部分笔记还不够完善,后续补上的话重点应该是这几年的前沿论文。
核方法
阅读资源:SVM中的核方法
https://zhuanlan.zhihu.com/p/27445103
1、Dependency Tree Kernels for Relation Extraction
思路:将句子转化为句法依赖树,构建增强依存树(Augmented Dependency Trees),得到一个句子和两个实体的各种特征,定义相应的核函数,计算不同树之间的相似度,最后用SVM进行分类。这种方法的缺点就是很依赖增强依存树的结果。
理由在于依赖树包含了句子中不同成分语法的依赖关系,作者认为具有相似关系的实例也会在其对应的依赖树上有相似的结构。核函数的目的就是找到依赖树之间的相似性。因此,再找到之后,只需将核函数并入SVM中,即可。
实验部分:
使用ACE数据集【只用到其中5个关系,没有用24个】
在SVM中使用不同的核,
K 0 = sparse kernel
K 1 = contiguous kernel
K 2 = bag-of-words kernel
K 3 = K 0 + K 2
K 4 = K 1 + K2
先用二分类的SVM进行关系检测:实体间是否存在关系,再用Libsvm进行关系分类。
进行二分类检测的理由:
Detecting relations is a difficult task for a kernel method because the set of all non-relation instances is extremely heterogeneous, and