![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
文章平均质量分 66
CV爵士天才
在校学生,刚刚踏入IT领域。
展开
-
From Two to One: A New Scene Text Recognizer withVisual Language Modeling Network
在本文中,我们抛弃了占主导地位的复杂语言模型,重新思考了场景文本识别中的语言学习过程。不同于以往将视觉和语言信息放在两个独立的结构中考虑的方法,我们提出了一种视觉语言建模网络(VisionLAN),它将视觉和语言信息作为一个整体,直接赋予视觉模型语言能力。特别地,我们在训练阶段引入了基于字符的遮挡特征图的文本识别。这样的操作引导视觉模型在视觉线索被混淆(如遮挡、噪声等)时,不仅利用字符的视觉纹理,还利用视觉语境中的语言信息进行识别。原创 2023-08-20 21:53:51 · 265 阅读 · 0 评论 -
文本识别领域优秀论文
计算机视觉领域文本识别方向优秀论文原创 2023-08-17 11:07:46 · 179 阅读 · 0 评论 -
使用OpenCV Python保存的视频打不开
OpenCV Python调用摄像头保存视频打不开的小bug。原创 2023-05-25 09:41:48 · 921 阅读 · 1 评论 -
图像降噪传统方法总揽
大概描述图像处理中图像降噪传统方法原创 2023-04-17 21:56:16 · 281 阅读 · 1 评论