RN Module(DeepMind 2017)
本文设计了一个用于relational reasoning的RN模块,可以嵌入到任何需要处理与realtion inference有关系的任务的神经网络之中,其设计哲学是:限制神经网络的函数形式使得其能抓住关系推理中最核心的公共属性。或者说,计算关系的能力就在RN的结构之中,就像CNN的结构就蕴含了推导空间属性、平移不变性的性质一样。
比如最简单的RN的函数形式就是 :
其中f和g都是MLP,O代表object的集合,o则是单个object。称g的输出为relation。RN具有三个强大的地方:学习推导关系;数据高效;作用于一组与顺序无关的object集合。
上面的式子表明RN应该考虑所有的object pairs之间的可能关系。也就是说RN不知道实际存在哪些relation或者某些relation有特殊的含义,RN必须推断relation的存在和含义。用RN增强的神经网络可以用在许多依赖关系推理的任务之上,比如visual QA,text-based QA,动态物理系统。
CLEVER数据集,包含3D渲染的object,比如球体、圆柱等等,每张图片都和一些不同类别的问题关联。比如,query attribute问题,“Wh