自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 CRNN——文本识别算法

CRNN文本识别算法

2022-09-17 15:53:01 3459 1

原创 MASTER:Multi-Aspect Non-local Network forScene Text Recognition

MASTER:文本识别

2022-09-17 15:31:30 603

原创 数据处理(txt的提取)

本人用于记录平时用的代码,仅供新手参考!!通常对数据进行处理,如提取txt文件里面的内容,将其分成训练集和测试集,但是测试集需要根据已有的文件名进行挑选,而训练集和测试集也就分开了。首先,将测试数据里面的文件名进行提取,然后根据该文件同已有的txt进行对比,再对其保存输出即代码如下:import sysimport jsonimport osfp = open("ttl.txt", "r")sample = fp.readlines()path_imgs = './valt/'

2021-07-27 17:46:23 1806

原创 OCR基础篇

1、什么是OCR?OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字是不可或缺的视觉信息来源。相对于图像/视频中的其他内容,文字往往包含更强的语义信息,因此对图像中的文字提取和识别具有重大意义。文字识别是计算机视觉研究领域的分支之一,而且这个课题已经是比较成熟了,并且在商业中已经有很多落地项目了。虽然很多企业都有能力开始从事OCR的各种任务,

2021-07-17 14:11:45 3495

原创 通俗理解GAN

GAN的主要结构包括一个生成器G(Generator)和一个判别器D(Discriminator)。G:一个生成图片的网络,它接收一个随机噪声z,通过这个噪声生成图片,记做G(z);D:一个判别网络,判别一张图片是不是“真实的”。它的输入参数是x,x代表一张图片,输出D(x)代表x为真实图片的概率。如果为1,就带包100%是真实的图片,而输出为0,就代表不可能是真实图片。在训练过程中,生成网络G的目标就是尽量生成真实的图片去欺骗判别网络D,而D的目标就是尽量把G生成的图片和真实的图片分别开来

2021-04-22 10:39:42 487

原创 生成对抗网络实现超分

生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN理论中,并不要求 G 和 D 都是神经网络,只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为 G 和 D 。一个优秀的GAN应用需要有良好的训练方法,.

2021-04-22 10:26:53 707 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除