Vision_Transformer
文章平均质量分 96
会唱歌的炼丹师
会唱歌的炼丹师
展开
-
Swin Transformer
CV+Transformer之Swin Transformer前言自从Transformer[1]在NLP任务上取得突破性的进展之后,业内一直尝试着把Transformer用于在CV领域。之前的若干尝试,例如iGPT[2],ViT[3]都是将Transformer用在了图像分类领域,目前这些方法都有两个非常严峻的问题受限于图像的矩阵性质,一个能表达信息的图片往往至少需要几百个像素点,而建模这种几百个长序列的数据恰恰是Transformer的天生缺陷;目前的基于Transformer框架更多的是用来原创 2021-12-01 22:03:26 · 6101 阅读 · 0 评论 -
中国软件杯——行人检测与跟踪(GitHub地址:https://github.com/dddlli/Swin-Transformer-Object-Detection-PaddlePaddle)
中国软件杯——行人检测与跟踪(GitHub地址:https://github.com/dddlli/Swin-Transformer-Object-Detection-PaddlePaddle)一、算法设计(一)行人检测部分1.Swin-Transformer作为Faster—RCNN和YOLOV3的backbone,作为特征提取的主干网络,在一定程度上替换了传统卷积神经网络Resnet和DarkNet等这些backbone作为的特征提取网络。自从Transformer[1]在NLP任务上取得突破原创 2021-07-13 11:13:24 · 2628 阅读 · 0 评论