知识驱动和数据驱动融合的一般范式
知识在混合模型中的作用反应在三个方面:输入、规则和结构
L是目标函数,(Xd,yd)表示数据集,fk表示输入数据的预处理,Xk表示知识张量,θ表示数据建模F的参数,θk表示模型的知识规则,§表示目标函数的参数,§k表示目标函数的知识规则
根据知识的表达形式和混合模型中的应用,基本的混合模型分为三部分。
1、知识作为输入
知识能够直接用标准的张量表示,被用作数据驱动模型原始输入的补充
知识张量Xk加入到数据驱动模型中
1.1知识用张量表示
知识向量用作辅助输入
1.2知识图谱
知识不能用向量直接表示,用知识图谱表示,知识图谱的实体、概念以及关系用离散和明确的符号表示,知识图谱的表示能够获得知识图谱组成元素(节点和边)的实值向量化表示
2、知识作为规则
知识不能直接作为输入,而是作为数据驱动模型的约束条件。
fk与§k分别表示输入数据的预处理和目标函数的知识规则
2.1人为先验知识
人工先验知识是指根据先验知识手工设定规则或定义问题
基于知识的损失函数例如:正则化损失和多重损失
2.2基于预处理的知识
基于知识的预处理根据已有的知识对输入的数据或标签进行预处理
2.3人为后验知识
指的是以后验为基础的知识,用知识去优化解决方案或直接预测,后验知识是从样本中学习或者从后验事实中总结。规则学习和知识图谱生成都属于后验知识
3、知识作为内隐模态
知识指导数据驱动模型的构建
加入了知识张量Xk和模型知识规则θk
3.1知识迁移
迁移学习:训练完的模型参数迁移到新任务上
知识蒸馏:简化模型
3.2相关经验转移
不同于直接知识迁移,互补学习理论
3.3知识细化任务
通过知识细化任务,分阶段细化任务,细化模块,增加整个学习步骤的可解释性。细化任务和特性解耦都属于知识细化任务。
论文下载地址: