首次公开!深度学习在知识图谱构建中的应用


阿里妹导读:在智能化时代的今天,搜索引擎不仅能理解用户检索的信息、并总结出与搜索话题相关的内容,更在逐步构建一个与搜索结果相关的完整知识体系,让用户获得意想不到的发现。神马搜索的知识图谱与应用团队就在这条路上不断探索中。


昨天,我们介绍了基于DeepDive的关系抽取方法及其在知识图谱数据构建中应用(传送门:知识图谱数据构建的“硬骨头”,阿里工程师如何拿下?这个方法准确率高、交互好,在单一关系的抽取任务中体现了强大的能力。今天,我们将为大家继续分享,基于深度学习的关系抽取技术及其在神马知识图谱数据构建中的探索和实践,以及业务落地过程中遇到的一些挑战,期待与大家一起交流探讨。


深度学习模型介绍


DeepDive系统在数据处理阶段很大程度上依赖于NLP工具,如果NLP的过程中存在错误,这些错误将会在后续的标注和学习步骤中被不断传播放大,影响最终的关系抽取效果。为了避免这种传播和影响,近年来深度学习技术开始越来越多地在关系抽取任务中得到重视和应用。本章主要介绍一种远程监督标注与基于卷积神经网络的模型相结合的关系抽取方法以及该方法的一些改进技术。


Piecewise Convolutional Neural Networks(PCNNs)模型


PCNNs模型由Zeng et al.于2015提出,主要针对两个问题提出解决方案:


  • 针对远程监督的wrong label problem,该模型提出采用多示例学习的方式从训练集中抽取取置信度高的训练样例训练模型。

  • 针对传统统计模型特征抽取过程中出现的错误和后续的错误传播问题,该模型提出用 piecewise 的卷积神经网络自动学习特征,从而避免了复杂的NLP过程。


下图是PCNNs的模型示意图:



PCNNs模型主要包括以下几个步骤:



评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值