自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

uncle_ll的博客

keep healthy, keep going.

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 OCR文本图像合成工具

OCR文本图像合成工具问题在进行文字识别时候，需要使用的数据集样式为一张含有文本的图片以及对应文本内容的标签。但是一般而言，实际情况是构建的文本字典中，每个字至少要出现200次才能有好的识别效果，因此，先对所有的label进行单字统计，看每个字出现的个数是否超过200次，如果不满足，则需要进一步收集数据。数据来源有两种：真实数据：通过真实数据去截取图片或者人工标注生成数据：通过文本去生成对应的文本图片真实数据的收集是比较费事费力的，因此可以使用一些生成数据的工具来无限量的生成想要的数据。

2020-10-27 17:14:35 1361 4

原创 Pymysql 连接池操作

https://www.coder.work/article/500786https://blog.51cto.com/lookingdream/2449109https://www.jianshu.com/p/53262bb292e5https://blog.csdn.net/jacke121/article/details/79852146https://blog.csdn.net/u010939285/article/details/71088145https://www.letianbij

2020-10-25 23:16:57 1168

原创 OCR相关介绍

OCR相关介绍0 计算机视觉技术（computer version）计算机视觉是人工智能的一个重要分支，它要解决的问题就是：看懂图像里的内容。人的大脑皮层，有差不多70% 都是在处理视觉信息。是人类获取信息最主要的渠道，没有之一。下图是网络上新增数据的占比趋势图。灰色是结构化数据，蓝色是非结构化数据（大部分都是图像和视频）。可以很明显的发现，图片和视频正在以指数级的速度在增长。而在计算机视觉出现之前，图像对于计算机来说是黑盒的状态。一张图片对于机器只是一个文件。机器并不知道图片里的内容到底

2020-10-24 13:15:26 6522

原创 OCR算法识别性能评估

评估OCR算法识别率的指标通常有这几种：one全对准确率：每张图片版面上有多个文本时候，每个文本都对的张数占总的张数的比例；标签全对准确率：每张图片版面上有多个文本时候，文本对的个数占总的文本个数的比例；平均编辑距离：平均编辑距离越小说明识别率越高。平均编辑距离主要衡量整行或整篇文章的指标，可以同时反应识别错，漏识别和多识别的情况；字符识别准确率，即识别对的字符数占总识别出来字符数的比例，可以反应识别错和多识别的情况，但无法反应漏识别的情况；字符识别召回率，即识别对的字符数占实际字符数的比例

2020-10-22 10:11:20 4532 1

原创目标检测图像数据增强（Data Augmentation）——对比度|加噪|随机调整颜色

数据扩增数据扩增是扩充数据的一项重要手段，原理是基于已有的标注数据，进行相应变化，其对应的标签不作改变或者也跟着有相应的变化。本次只对原始图片进行更改，label保持不变。即只变动原始数据，生成新的图像的label与原始图像一样，只是文件名变了import skimageimport osimport shutilimport sysfrom PIL import Image, ImageEnhance, ImageChopsimport randomimport numpy as np

2020-10-16 18:23:25 2737 10

原创批量将xml标注数据转为yolo所需与的txt格式标注数据

#!/usr/bin/env python3# -*- coding: utf-8 -*-import copyfrom lxml.etree import Element, SubElement, tostring, ElementTreeimport xml.etree.ElementTree as ETimport pickleimport osfrom os import listdir, getcwdfrom os.path import joinclasses = ["姓

2020-10-13 19:19:56 1094 4

原创算法统一图片输入格式RGB/BGR

统一图片输入格式问题在做一些图像处理项目时候，有些模型对输入图片格式有一定的要求，不一致的图片格式输入进去可能会造成一些错误情况出现；统一输入图片读取后的格式是非常有必要的；在opencv中，使用cv2.imread读取jpg类型图片，得到的图像矩阵形式是bgr格式；对于png类型图片，得到的图像矩阵形式是RBG格式；如果算法处理的图片既有jpg又有png，那么很有必要在算法入口处对两种图片得到的图像矩阵格式进行统一方法假设这里算法需要的是rgb类型格式的图片矩阵，传入的是本地图片的名称img

2020-10-10 18:10:12 1673

s3-python.pdf

亚马逊 aws s3 python接口文档可供参考

2020-09-01

中国医学影像AI白皮书.pdf

白皮书 | 医学影像

2020-08-31

2019年武汉市文化与金融白皮书报告.pdf

武汉市文化与金融白皮书 2019 。

2019-11-10

deppfake.pdf

deepface ppt介绍如何使用的

2019-10-29

今日头条20代年轻人群指数研究报告-2019.8-58页.pdf

今日头条人群消费调查，涵盖各个行业。

2019-10-18

HammerDB mysql及oracle数据库性能测试工具

适合Linux 64位系统，mysql及oracle性能的小工具。的

2017-08-07

智能时代吴军 .mobi 电子书

大数据和机器智能的出现，对我们的技术发展、商业和社会都会产生重大的影响。作者吴军在《智能时代：大数据与智能革命重新定义未来》中指出，首先，我们在过去认为非常难以解决的问题，会因为大数据和机器智能的使用而迎刃而解，比如解决癌症个性化治疗的难题。同时，大数据和机器智能还会彻底改变未来的商业模式，很多传统的行业都将采用智能技术实现升级换代，同时改变原有的商业模式。大数据和机器智能对于未来社会的影响是全方位的。

2016-10-16

Stefano Mattoccia 的讲义 Stereo Vision: algorithms and applications

Stefano Mattoccia 的讲义 Stereo Vision: algorithms and applications，自己花了很大力气下下来的，对立体视觉的讲解和各种方法的比较

2016-09-14

鸟叔私房菜

ARM的一些资料，浅俗易懂，可以自行下载浏览自学。

2014-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除