- 博客(7)
- 资源 (12)
- 收藏
- 关注
原创 OCR文本图像合成工具
OCR文本图像合成工具问题在进行文字识别时候,需要使用的数据集样式为一张含有文本的图片以及对应文本内容的标签。但是一般而言,实际情况是构建的文本字典中,每个字至少要出现200次才能有好的识别效果,因此,先对所有的label进行单字统计,看每个字出现的个数是否超过200次,如果不满足,则需要进一步收集数据。数据来源有两种:真实数据:通过真实数据去截取图片或者人工标注生成数据:通过文本去生成对应的文本图片真实数据的收集是比较费事费力的,因此可以使用一些生成数据的工具来无限量的生成想要的数据。
2020-10-27 17:14:35 1361 4
原创 Pymysql 连接池操作
https://www.coder.work/article/500786https://blog.51cto.com/lookingdream/2449109https://www.jianshu.com/p/53262bb292e5https://blog.csdn.net/jacke121/article/details/79852146https://blog.csdn.net/u010939285/article/details/71088145https://www.letianbij
2020-10-25 23:16:57 1168
原创 OCR相关介绍
OCR相关介绍0 计算机视觉技术(computer version)计算机视觉是人工智能的一个重要分支,它要解决的问题就是:看懂图像里的内容。人的大脑皮层, 有差不多70% 都是在处理视觉信息。 是人类获取信息最主要的渠道,没有之一。下图是网络上新增数据的占比趋势图。灰色是结构化数据,蓝色是非结构化数据(大部分都是图像和视频)。可以很明显的发现,图片和视频正在以指数级的速度在增长。而在计算机视觉出现之前,图像对于计算机来说是黑盒的状态。一张图片对于机器只是一个文件。机器并不知道图片里的内容到底
2020-10-24 13:15:26 6522
原创 OCR算法识别性能评估
评估OCR算法识别率的指标通常有这几种:one全对准确率: 每张图片版面上有多个文本时候,每个文本都对的张数占总的张数的比例;标签全对准确率:每张图片版面上有多个文本时候,文本对的个数占总的文本个数的比例;平均编辑距离:平均编辑距离越小说明识别率越高。平均编辑距离主要衡量整行或整篇文章的指标,可以同时反应识别错,漏识别和多识别的情况;字符识别准确率,即识别对的字符数占总识别出来字符数的比例,可以反应识别错和多识别的情况,但无法反应漏识别的情况;字符识别召回率,即识别对的字符数占实际字符数的比例
2020-10-22 10:11:20 4532 1
原创 目标检测图像数据增强(Data Augmentation)——对比度|加噪|随机调整颜色
数据扩增数据扩增是扩充数据的一项重要手段,原理是基于已有的标注数据,进行相应变化,其对应的标签不作改变或者也跟着有相应的变化。本次只对原始图片进行更改,label保持不变。即只变动原始数据,生成新的图像的label与原始图像一样,只是文件名变了import skimageimport osimport shutilimport sysfrom PIL import Image, ImageEnhance, ImageChopsimport randomimport numpy as np
2020-10-16 18:23:25 2737 10
原创 批量将xml标注数据转为yolo所需与的txt格式标注数据
#!/usr/bin/env python3# -*- coding: utf-8 -*-import copyfrom lxml.etree import Element, SubElement, tostring, ElementTreeimport xml.etree.ElementTree as ETimport pickleimport osfrom os import listdir, getcwdfrom os.path import joinclasses = ["姓
2020-10-13 19:19:56 1094 4
原创 算法统一图片输入格式RGB/BGR
统一图片输入格式问题在做一些图像处理项目时候,有些模型对输入图片格式有一定的要求,不一致的图片格式输入进去可能会造成一些错误情况出现;统一输入图片读取后的格式是非常有必要的;在opencv中,使用cv2.imread读取jpg类型图片,得到的图像矩阵形式是bgr格式; 对于png类型图片,得到的图像矩阵形式是RBG格式;如果算法处理的图片既有jpg又有png,那么很有必要在算法入口处对两种图片得到的图像矩阵格式进行统一方法假设这里算法需要的是rgb类型格式的图片矩阵, 传入的是本地图片的名称img
2020-10-10 18:10:12 1673
智能时代 吴军 .mobi 电子书
2016-10-16
Stefano Mattoccia 的讲义 Stereo Vision: algorithms and applications
2016-09-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人