自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Hierarchical Question-Image Co-Attention for Visual Question Answering ——NIPS2016

Hierarchical Question-Image Co-Attention for Visual Question Answering ——2016NIPS 文章链接: https://arxiv.org/pdf/1606.00061v1.pdf Hierarchical Question-Image Co-Attention for Visual Question Answering 概括...

2019-04-17 14:39:47 395

原创 Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding——EMNLP2016

Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding——EMNLP2016 文章链接: https://arxiv.org/pdf/1606.01847v3.pdf 概述:本文的主要工作点在多模态融合时 两个特征的融合使用双线性(外积、克罗内克积)能够更好更全面地表征 但外积使维...

2019-04-17 14:39:32 1548

原创 Where To Look: Focus Regions for Visual Question Answering——CVPR2016

Where To Look: Focus Regions for Visual Question Answering——CVPR2016 文章链接: https://arxiv.org/pdf/1511.07394.pdf Where To Look: Focus Regions for Visual Question Answering 概括:个人感觉where to look 的地位有点相当于...

2019-04-17 14:39:16 485

原创 Coling18 VQA JP

Visual Question Answering Dataset for Bilingual Image Understanding: A Study of Cross-Lingual Transfer Using Attention Maps ——Coling18 文章链接: https://www.aclweb.org/anthology/C18-1163 概述:该文章主要是考虑到日语vqa...

2019-04-17 14:39:03 108

原创 目标检测&语义分割简述

语义分割与目标检测入门:若干经典工作综述

2019-04-17 14:38:46 849

转载 上采样与下采样

缩小图像(或称为下采样(subsampled)或降采样(downsampled))的主要目的有两个:1、使得图像符合显示区域的大小;2、生成对应图像的缩略图。 放大图像(或称为上采样(upsampling)或图像插值(interpolating))的主要目的是放大原图像,从而可以显示在更高分辨率的显示设备上。对图像的缩放操作并不能带来更多关于该图像的信息, 因此图像的质量将不可避免地受到影...

2019-04-17 14:38:13 717

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除