![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CVTransformer
文章平均质量分 81
Patrick Star1
我对任何唾手可得,快速,出自本能,即兴,含混的事物没有信心。我相信缓慢,平和,细水长流的力量,踏实,冷静。我不相信缺乏自律精神和不自我建设,不努力,可以得到个人或集体的解放。
展开
-
【ICCV2023】 MRN:一种多路复用路由网络的增量多语言文本识别方法
ICCV 2023 MRN: Multiplexed Routing Network for Incremental Multilingual Text Recognition原创 2023-07-25 01:10:11 · 313 阅读 · 0 评论 -
【文本识别系列】Show, Attend and Read: A Simple and Strong Baseline for Irregular Text Recognition
论文原文:【链接】解读代码:【链接】原创 2021-07-15 18:55:59 · 1073 阅读 · 1 评论 -
【OCR文本识别系列】Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Tex
read like humans 是中科大在2021年发在CVPR上的论文论文链接 【链接】代码链接【链接】视觉模型class BaseVision(Model): def __init__(self, config): super().__init__(config) if config.model_vision_backbone == 'transformer': self.backbone = ResTranformer(原创 2021-07-06 15:50:36 · 1161 阅读 · 0 评论 -
【零基础讲论文源码】gMLP:Pay Attention to MLPs
Transformer方向 swin-transformer解读【链接】 CVT 解读【链接】 gMLP解读【链接】gMLP是一种使用MLP来获得transformer性能的方法,谷歌用更少的参数在大量实验上达到了transformer同样的精度。gMLP的论文地址【链接】讲解的代码地址【链接】gMLP结构class gMLP(nn.Module): def __init__( self, *, ...原创 2021-05-31 16:39:55 · 2714 阅读 · 0 评论 -
【零基础讲论文源码】Swin-Transformer源代码阅读
Swin-transformer是微软 CVPR2021今年最近一篇非常棒的论文。Github【源代码地址】原文地址【地址】先上个结构图:(为方便阅读,代码进行简化)SwinTransformer: 主代码#整体结构中,通过PatchEmbed()分割出图像块,再经过相应层数的BasicLayer()。class SwinTransformer(nn.Module): def __init__(): super().__init__() # spl原创 2021-04-13 19:59:46 · 7619 阅读 · 7 评论 -
【零基础讲论文源码】CVT:Introducing Convolutions to Vision Transformers
目前这个系列会开两个方向, cv transformer 和OCR方向。Transformer方向 swin-transformer解读【链接】 CVT 解读【链接】 待续。。。OCR方向 DBnet解读【链接】(正在制作中。。。) PP_OCR【链接】(待续。。。) 待续。。。整体介绍:CvT: Introducing Convolutions to Vision Transformers,刚发不久的一篇文章,最近Transformer很多,之所有现在选这一篇是因为方法简洁高效原创 2021-04-27 20:13:27 · 5913 阅读 · 9 评论