实时字幕生成原理挖掘——论文解读DenseCap: Fully Convolutional Localization Networks for Dense Captioning
先来看看denesecap的效果, 对比之前的Image Caption 由单目标变成了多目标。就好比之前的Image Classfication 发展到 Object Detection其实Image Caption发展到densecap本质上也是借鉴了Faster RCNN进行Object Detection的手法。在一个前向运算中就完成了 Proposal 和 Caption的工作
原创
2016-11-05 14:17:15 ·
4858 阅读 ·
0 评论