- 博客(4)
- 收藏
- 关注
原创 【论文阅读】Perceiving Stroke-Semantic Context: Hierarchical Contrastive Learning for Robust Scene Text Re
提出PerSec(Perceiving Stroke-Semantic Context)由于场景文本图像同时拥有视觉和语义属性,本文为提出的PreSec配备了双重上下文感知器,可以通过对未标记的文本图像数据的分层对比学习同时获取和比较赖在低级笔画和高级语义上下文空间的潜在表征。实验表明本文提出的方法在获取到更好的结果的同时具有很强的泛化性能。
2023-03-30 15:36:15 370 3
原创 【论文阅读】Turning a CLIP Model into a Scene Text Detector
场景文本包含有丰富的文本(语义)和视觉信息,与CLIP模型有天然的联系。提出的框架可以用于改进现有的场景文本检测器促进了现有方法的few-shot训练能力将CLIP模型迁移到现有的场景文本检测方法中,进一步实现较好的区域适应能力(domain adaptation ability)
2023-03-29 09:50:11 726 1
原创 【笔记】Transformer for Single Image Super-Resolution
本文介绍了一种用于图像超分辨的Transformer,与之前的一些视觉Transformer模型相比更加轻量化,计算量更小,并占用更小的显存。
2023-03-01 19:38:06 488 1
原创 【笔记】场景文本超分辨——Scene Text Image Super-Resolution in the wild
这是一篇2020年发表在ECCV上有关场景文字超分辨的文章。三点贡献:1.提出了Text Zoom数据集2.说明了场景文本图像超分辨的重要性3.提出了一种文本超分辨网络paper:https://arxiv.org/pdf/2005.03341.pdfcode:GitHub - JasonBoy1/TextZoom: A super-resolution dataset of paired LR-HR scene text images一、Text Zoom 数据集由于之..
2022-03-30 21:23:13 1237 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人