自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 【论文阅读】Perceiving Stroke-Semantic Context: Hierarchical Contrastive Learning for Robust Scene Text Re

提出PerSec(Perceiving Stroke-Semantic Context)由于场景文本图像同时拥有视觉和语义属性,本文为提出的PreSec配备了双重上下文感知器,可以通过对未标记的文本图像数据的分层对比学习同时获取和比较赖在低级笔画和高级语义上下文空间的潜在表征。实验表明本文提出的方法在获取到更好的结果的同时具有很强的泛化性能。

2023-03-30 15:36:15 342 3

原创 【论文阅读】Turning a CLIP Model into a Scene Text Detector

场景文本包含有丰富的文本(语义)和视觉信息,与CLIP模型有天然的联系。提出的框架可以用于改进现有的场景文本检测器促进了现有方法的few-shot训练能力将CLIP模型迁移到现有的场景文本检测方法中,进一步实现较好的区域适应能力(domain adaptation ability)

2023-03-29 09:50:11 688 1

原创 【笔记】Transformer for Single Image Super-Resolution

本文介绍了一种用于图像超分辨的Transformer,与之前的一些视觉Transformer模型相比更加轻量化,计算量更小,并占用更小的显存。

2023-03-01 19:38:06 471 1

原创 【笔记】场景文本超分辨——Scene Text Image Super-Resolution in the wild

这是一篇2020年发表在ECCV上有关场景文字超分辨的文章。三点贡献:1.提出了Text Zoom数据集2.说明了场景文本图像超分辨的重要性3.提出了一种文本超分辨网络paper:https://arxiv.org/pdf/2005.03341.pdfcode:GitHub - JasonBoy1/TextZoom: A super-resolution dataset of paired LR-HR scene text images一、Text Zoom 数据集由于之..

2022-03-30 21:23:13 1208 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除