Harnessing Deep Neural Networks with Logic Rules论文解读

该论文提出了一种将深度神经网络与一阶逻辑规则相结合的框架,旨在提高模型的可解释性和减少对大量训练数据的依赖。通过反复蒸馏方法,将逻辑规则的结构化信息注入神经网络权重,实现在CNN和RNN上的应用,如情感分类和命名实体识别。实验表明,这种方法能显著提升模型性能并增强可解释性。
摘要由CSDN通过智能技术生成

作者信息:Zhiting Hu、Xuezhe Ma、Zhengzhong Liu、Eduard Hovy、Eric P.Xing,都来自CMU

问题:深度神经网络一个很大的问题是不可解释性,另一个问题是往往需要大量的训练数据。因此,我们希望能够在深度神经网络中引入一些知识,一方面可以帮助训练,另一方面能提高模型的可解释性。具体的知识形式可以采用逻辑规则,因为它能较好地建模人类的认知思维和先验知识。那么如何将深度神经网络和逻辑规则结合起来?

摘要:将深度神经网络与结构化的逻辑规则结合在一起是可取的,可以控制神经模型的灵活性,减少模型的不可解释性。文章提出一个通用框架,能够用声明的一阶逻辑规则来提升多种神经网络。特别的,文章开发了一种反复蒸馏方法,可以将逻辑规则的结构化信息转移到神经网络的权值中。文章在语句分析的CNN网络上以及命名实体识别的RNN网络上实现了框架。通过一些高度直观的规则,实验获得了大量的提升,得到了state-of-the-art结果,或者和之前最好的系统相比有了竞争性的结果。

深度神经网络在许多领域都获得了十分显著的进展,但是神经网络的高准确性严重依赖于大量的标注数据,并且纯粹的数据驱动学习会导致结果的不可解释性和直观性。如果没有昂贵的直接监督或特别初始化,也很难编码人的意图来指导模型捕获期望的模式。

另一方面,人类行为的识别过程表明,人类的学习不仅来源于具体的例子,还来源于不同形式的通用知识和丰富的经验。逻辑规则为高阶认知与表达逻辑化知识提供了一个灵活的声明语言。因此,将逻辑规则注入到DNN中是可行的,将人类意图和领域知识注入到神经模型,然后控制学习过程。

文章的框架将逻辑结构化知识封装到神经网络中,是通过迫使网络模拟一个规则化教师的预测

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值