Neural Module Networks CVPR2016
开源代码 http://github.com/jacobandreas/nmn2
本文也是针对 Visual question answering 这个问题的,还是用 CNN网络,这里使用一个语义解析器(natural language parser)来动态的决定一个CNN网络,CNN网络有几个模块过程,通过语义解析器,我们动态的通过组合模块构成一个 CNN网络来解决 图像问答问题。
这里介绍了一下几个模块:
模型组合示例如下图所示:
图像问答结果示例
Visual question answering 是个研究热点啊