关系抽取-联合抽取

最新推荐文章于 2023-06-26 11:15:17 发布

weixin_50537904

最新推荐文章于 2023-06-26 11:15:17 发布

阅读量1k

点赞数 2

分类专栏：知识图谱文章标签： pytorch 自然语言处理深度学习

本文链接：https://blog.csdn.net/weixin_50537904/article/details/120831239

版权

知识图谱专栏收录该内容

3 篇文章 0 订阅

订阅专栏

联合抽取-CasRel
在这里插入图片描述核心思想：先识别出SPO中的subject,然后对所有关系中预测含有subject的object，从而完成关系抽取。其中subject和object中在大多数论文中又有头实体和尾实体的说话，也就是一个实体的开始和结尾，以此完成关系抽取前的实体识别。
1.实体识别
关键代码：
subject识别

class CasRel(nn.Module):
    def __init__(self, config):
        super(CasRel, self).__init__()
        self.config = config
        self.bert = BertModel.from_pretrained(self.config.bert_name)
        # nn.linear相当于初始化矩阵
        self.sub_heads_linear = nn.Linear(self.config.bert_dim, 1)
        self.sub_tails_linear = nn.Linear(self.config.bert_dim, 1)
        self.obj_heads_linear = nn.Linear(self.config.bert_dim, self.config.num_relations)
        self.obj_tails_linear = nn.Linear(self.config.bert_dim, self.config.num_relations)

    def get_encoded_text(self, token_ids, mask):
        encoded_text = self.bert(token_ids, attention_mask=mask)[0]
        return encoded_text

    def get_subs(self, encoded_text):
        pred_sub_heads = torch.sigmoid(self.sub_heads_linear(encoded_text))
        pred_sub_tails = torch.sigmoid(self.sub_tails_linear(encoded_text))
        return pred_sub_heads, pred_sub_tails

object识别：

def get_objs_for_specific_sub(self, sub_head_mapping, sub_tail_mapping, encoded_text):
        # sub_head_mapping [batch, 1, seq] * encoded_text [batch, seq, dim]
        sub_head = torch.matmul(sub_head_mapping, encoded_text)
        sub_tail = torch.matmul(sub_tail_mapping, encoded_text)
        # 实体编码求平均
        sub = (sub_head + sub_tail) / 2
        encoded_text = encoded_text + sub
        pred_obj_heads = torch.sigmoid(self.obj_heads_linear(encoded_text))
        pred_obj_tails = torch.sigmoid(self.obj_tails_linear(encoded_text))
        return pred_obj_heads, pred_obj_tails

2.关系抽取

    def forward(self, token_ids, mask, sub_head, sub_tail):
        # 获得bert编码
        encoded_text = self.get_encoded_text(token_ids, mask)
        # 识别出SPO的subject实体对象的头和尾，是则1，不是则0
        pred_sub_heads, pred_sub_tails = self.get_subs(encoded_text)

        sub_head_mapping = sub_head.unsqueeze(1)
        sub_tail_mapping = sub_tail.unsqueeze(1)
        pred_obj_heads, pre_obj_tails = self.get_objs_for_specific_sub(sub_head_mapping, sub_tail_mapping, encoded_text)

        return {
            "sub_heads": pred_sub_heads,
            "sub_tails": pred_sub_tails,
            "obj_heads": pred_obj_heads,
            "obj_tails": pre_obj_tails,
        }

weixin_50537904

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
关系抽取-联合抽取

联合抽取-CasRel核心思想：先识别出SPO中的subject,然后对所有关系中预测含有subject的object，从而完成关系抽取。其中subject和object中在大多数论文中又有头实体和尾实体的说话，也就是一个实体的开始和结尾，以此完成关系抽取前的实体识别。1.实体识别关键代码：subject识别class CasRel(nn.Module): def __init__(self, config): super(CasRel, self).__init__()
复制链接

扫一扫