Splatoon7-CSDN博客

原创 Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions

A. 问题首先，对于dense prediction tasks，完全无卷积的的transformer backbone少有人研究。而VIT作为用在图像分类任务的完全transformer结构，很难直接应用于像素级别的dense prediction，例如目标检测与分割。原因：（1）只有一个尺度的低分辨率输出（2）内存与计算复杂度限制。为了解决完全transformer对于dense prediction的限制，提出PVT，与vit相比，好处（1）输入输出可以更小（4x4,...

2021-03-05 16:36:39 2146 2

原创 Efficient Transformer based Method for Remote Sensing Image Change Detection

A. 问题时空信息对于目标检测任务十分重要。CNN方法对于利用时空信息，有增大感受野（deep,空洞卷积，注意力机制等）得方法。然而，现有得问题还是无法解决relate long-range concepts in space-time。因此，引入transformer。B. 方法3个部分，分别是semantic tokenizer，transformer encoder和transformer decoder。1）semantic tokenizer2-3）transfor..

2021-03-02 17:19:02 1051

翻译 Low-shot Visual Recognition by Shrinking and Hallucinating Features

3个组成It employs a learner, two training phases, and one testing phase.1. learnerThe learner is assumed to be composed of a feature extractor and a multi-class classifier.2. traing phased one （r...

2018-11-08 16:55:40 1090

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人