基于多级注意力融合机制的藏文实体关系抽取

最新推荐文章于 2024-09-03 17:22:28 发布

宋罗世家技术屋

最新推荐文章于 2024-09-03 17:22:28 发布

阅读量79

点赞数

分类专栏：智能信息系统与结构理论专栏文章标签： python 机器学习算法

本文链接：https://blog.csdn.net/qq_61890005/article/details/134916813

版权

智能信息系统与结构理论专栏专栏收录该内容

48 篇文章 0 订阅 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

针对藏文实体关系抽取的挑战，本文提出一种基于多级注意力融合机制的模型，结合远程监督构建训练语料。通过词级和句子级的注意力机制减少错误标记的影响，利用联合评分函数修正错误标签，并结合SVM提高分类准确性。实验结果显示，该模型在藏文实体关系抽取任务上提高了准确率。

摘要由CSDN通过智能技术生成

【摘要】与中英文相比，藏文实体关系训练语料规模较小，传统有监督的学习方法难以获得较高的准确率。针对基于远程监督的实体关系抽取存在错误标记的问题，利用远程监督方法将知识库与文本对齐，构建藏文实体关系抽取的数据集，提出一个基于多级注意力融合机制的藏文实体关系抽取模型。在词级别引入自注意力机制来提取单词的内部特征，在句子级别引入注意力机制为每个实例分配权重，从而充分利用包含信息的句子，减少噪声实例的权重。同时引入联合评分函数，修正远程监督的错误标签，并将神经网络与支持向量机结合，实现藏文实体关系分类。实验结果表明，提出的模型有效提高了藏文实体关系抽取的准确率，且优于基线模型效果。

【关键词】藏文 ; 实体关系抽取 ; 多级注意力融合机制 ; 支持向量机

1 引言

实体关系抽取从无结构化文本中自动抽取实体对之间的语义关系，并构建结构化的知识，为知识图谱、问答系统等研究提供重要的支撑。相比于语料丰富的中英文领域，藏文实体关系训练语料规模较小，传统有监督的学习方法难以获得较高的准确率。为了解决训练语料不足的问题，Mintz M等人提出了利用远程监督自动生成训练语料的方法，其主要思想是对齐知识库和文本，将对齐后的句子构建成实体关系抽取的训练数据，并用其训练关系抽取器，预测文本中实体对之间的关系。

基于远程监督的方法可以为藏文实

了解本专栏

超级会员免费看

宋罗世家技术屋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于多级注意力融合机制的藏文实体关系抽取

与中英文相比，藏文实体关系训练语料规模较小，传统有监督的学习方法难以获得较高的准确率。针对基于远程监督的实体关系抽取存在错误标记的问题，利用远程监督方法将知识库与文本对齐，构建藏文实体关系抽取的数据集，提出一个基于多级注意力融合机制的藏文实体关系抽取模型。在词级别引入自注意力机制来提取单词的内部特征，在句子级别引入注意力机制为每个实例分配权重，从而充分利用包含信息的句子，减少噪声实例的权重。同时引入联合评分函数，修正远程监督的错误标签，并将神经网络与支持向量机结合，实现藏文实体关系分类。
复制链接

扫一扫