自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (19)
  • 收藏
  • 关注

转载 深度学习初学者不可不知的25个术语和概念

知名企业家、同时也是 NBA 小牛队的老板马克·库班(Mark Cuban)曾说过一句话:人工智能,深度学习和机器学习,不论你现在是否能够理解这些概念,你都应该学习。否则三年内,你就会像灭绝的恐龙一样被社会淘汰。马克·库班的这番话乍听起来有些耸人听闻,但仔细想想却不无道理。我们正经历一场大革命,这场革命就是由大数据和强大的电脑计算能力发起的。为了更好地面对和适应这场革命,了解一下相关的概念已经十分

2018-01-31 22:01:58 3968 1

原创 卷积神经网络 1*1 卷积核

卷积神经网络中卷积核的作用是提取图像更高维的特征,一个卷积核代表一种特征提取方式,对应产生一个特征图,卷积核的尺寸对应感受野的大小。经典的卷积示意图如下: 5*5的图像使用3*3的卷积核进行卷积,结果产生3*3(5-3+1)的特征图像。卷积核的大小一般是(2n+1)*(2n+1)的奇数乘奇数大小(n>=1),最常用的有3*3,5*5,7*7的。之所有使用奇数*奇

2018-01-31 21:27:39 9359

原创 LeNet-5网络结构及训练参数计算

经典神经网络诞生记:      1、LeNet,1998年  2、AlexNet,2012年  3、ZF-net,2013年  4、GoogleNet,2014年  5、VGG,2014年  6、ResNet,2015年LeNet-5LeNet-5是由 Yann LeCun 等人于1998年提出的,是一个用于识别手写数字的网络,其网络结构图如下所示:

2018-01-30 21:09:28 11573 5

原创 Python 把二进制mnist数据库转换为图片

mnist数据库可以通过caffe里的get_mnist.sh文件下载,路径是: caffe-master/data/mnist/get_mnist.sh,get_mnist.sh内容如下:#!/usr/bin/env sh# This scripts downloads the mnist data and unzips it.DIR="$( cd "$(dirname "$0")"

2018-01-29 19:23:03 1662

原创 python 绘图---2D、3D散点图、折线图、曲面图

python中绘制2D曲线图需要使用到Matplotlib,Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形,通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。1. 绘制折线图plt.plot() 可以用于绘制折线图。只传入一维的散点(n个)p1

2018-01-29 11:55:08 54862 3

原创 Pythond 读写HDF5文件

HDF(Hiearchical Data Format)是一种针对大量数据进行组织和存储的文件格式,可以存储不同类型的图像和数码数据的文件格式,并且可以在不同类型的机器上传输。HDF是美国国家高级计算应用中心(National Center for Supercomputing Application,NCSA)为了满足各种领域研究需求而研制的一种能高效存储和分发科学数据的新型数据格式。它的通

2018-01-29 09:35:58 11033 2

原创 Python创建CRNN训练用的LMDB数据库文件

CRNN简介CRNN由 Baoguang Shi, Xiang Bai, Cong Yao提出,2015年7月发表论文:“An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition”,链接地址:https:...

2018-01-26 12:11:49 9447 16

原创 keras 入门模型训练

# -*- coding: utf-8 -*-from keras.models import Sequentialfrom keras.layers import Densefrom keras.models import load_modelimport matplotlib.pyplot as pltimport numpy as npnp.random.seed(1) ...

2018-01-25 21:17:29 1113

原创 Python assert 断言

assert断言语句用来声明某个条件是真的,其作用是测试一个条件(condition)是否成立,如果不成立,则抛出异常。assert一般用法:assert condition如果condition为false,就raise一个AssertionError出来。逻辑上等同于:if not condition:    raise AssertionError()

2018-01-25 21:03:15 10421

原创 OpenCV-Python cv2.imdecode()和cv2.imencode() 图片解码和编码

cv2.imdecode()函数从指定的内存缓存中读取数据,并把数据转换(解码)成图像格式;主要用于从网络传输数据中恢复出图像。cv2.imencode()函数是将图片格式转换(编码)成流数据,赋值到内存缓存中;主要用于图像数据格式的压缩,方便网络传输。imdecode()使用从网络读取图像数据并转换成图片格式:# -*- coding: utf-8 -*-i

2018-01-25 20:52:33 170418 20

原创 使用Python和OpenCV通过网址URL获取图片

在OpenCV中通过图片的URL地址获取图片:# -*- coding: utf-8 -*-import numpy as npimport urllibimport cv2# URL到图片def url_to_image(url): # download the image, convert it to a NumPy array, and then read

2018-01-25 20:36:34 10862 2

原创 python中读写LMDB数据库

LMDB的全称是Lightning Memory-Mapped Database(快如闪电的内存映射数据库),它的文件结构简单,包含一个数据文件和一个锁文件:LMDB文件可以同时由多个进程打开,具有极高的数据存取速度,访问简单,不需要运行单独的数据库管理进程,只要在访问数据的代码里引用LMDB库,访问时给文件路径即可。让系统访问大量小文件的开销很大,而LMDB使用内存映射的

2018-01-25 20:20:08 25686 4

原创 Linux中几个实用快捷键

返回上层目录: cd .. 命令提示符: user@ubuntu: @之前的部分为当前用户ID名称; @之后冒号之前是主机名称 sudo :(Superusers Do) 以超级用户执行 在相对路径中, . 表示当前目录, .. 表示当前目录的上一级目录 pwd: (print working directory) 显示当前目录 ~ : 代表当前用户的home目录,也就是 /home.........

2018-01-24 20:53:51 2656

原创 OpenCV-Python在图片上输出中文

OpenCV中在图片上输出中文一般需要借助FreeType库实现。FreeType库是一个完全免费(开源)的、高质量的且可移植的字体引擎,它提供统一的接口来访问多种字体格式文件。但使用FreeType需要下载库并重新编译,过程麻烦一点。在Python中,可以借助PIL(Python Imaging Library)模块实现,相对简单很多,需要做的只是对图像进行OpenCV格式和PIL格式的相互

2018-01-19 21:42:22 23372 11

原创 tensorflow中使用tf.ConfigProto()配置Session运行参数&&GPU设备指定

tf.ConfigProto()函数用在创建session的时候,用来对session进行参数配置:  config = tf.ConfigProto(allow_soft_placement=True, allow_soft_placement=True)config.gpu_options.per_process_gpu_memory_fraction = 0.4 #占用40...

2018-01-18 21:08:36 71472 11

原创 python2和python3 print输出不换行

python2 print不换行在print最后加上一个逗号,会把两个输出打印在同一行,不过两个输出之间有一个空格的间隔,例如:print '{0}'.format(123),print '{0}'.format(456)输出:123 456如果没有逗号:print '{0}'.format(123)print '{0}'.format(456)输出:123456python3 print不换行p

2018-01-18 20:41:56 84561 2

原创 超简单tensorflow入门优化程序&&tensorboard可视化

程序1任务描述: x = 3.0, y = 100.0, 运算公式 x×W+b = y,求 W和b的最优解。使用tensorflow编程实现:#-*- coding: utf-8 -*-)import tensorflow as tf# 声明占位变量x、yx = tf.placeholder("float",shape=[None,1])y = tf.plac

2018-01-12 18:12:46 2033 2

原创 tf.random_normal()函数

tf.random_normal()函数用于从“服从指定正态分布的序列”中随机取出指定个数的值。tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None) shape: 输出张量的形状,必选 mean: 正态分布的均值,默认为0 stddev: 正态...

2018-01-11 21:43:20 122582 18

原创 tensorflow中创建多个计算图(Graph)

tf程序中,系统会自动创建并维护一个默认的计算图,计算图可以理解为神经网络(Neural Network)结构的程序化描述。如果不显式指定所归属的计算图,则所有的tensor和Operation都是在默认计算图中定义的,使用tf.get_default_graph()函数可以获取当前默认的计算图句柄。# -*- coding: utf-8 -*-)import tensorflow as t

2018-01-11 21:38:55 15450 2

原创 tensorflow中有向图(计算图、Graph)、上下文环境(Session)和执行流程

计算图(Graph)Tensorflow是基于图(Graph)的计算框架,图的节点由事先定义的运算(操作、Operation)构成,图的各个节点之间由张量(tensor)来链接,Tensorflow的计算过程就是张量(tensor)在节点之间从前到后的流动传输过程,如下图示例:有向图中,节点通常代表数学运算,边表示节点之间的某种联系,它负责传输多维数据(Tensors)。节

2018-01-11 21:29:13 8302

原创 tensorflow中常量(constant)、变量(Variable)、占位符(placeholder)和张量类型转换reshape()

常量 constanttf.constant()函数定义:def constant(value, dtype=None, shape=None, name="Const", verify_shape=False)value: 符合tf中定义的数据类型的常数值或者常数列表;dtype:数据类型,可选;shape:常量的形状,可选;name:常量的名字,可选;verif

2018-01-09 21:52:33 19457

原创 tensorflow中张量(tensor)的属性——维数(阶)、形状和数据类型

tensorflow的命名来源于本身的运行原理,tensor(张量)意味着N维数组,flow(流)意味着基于数据流图的计算,所以tensorflow字面理解为张量从流图的一端流动到另一端的计算过程。tensorflow中的所有数据如图片、语音等都是以张量这种数据结构的形式表示的。张量是一种组合类型的数据类型,表示为一个多维数组,通用的表示形式为[T1,T2,T3,…Tn]  ,其中

2018-01-09 20:47:50 29771 10

原创 tensorflow训练验证码识别模型

tensorflow训练验证码识别模型的样本可以使用captcha生成,captcha在linux中的安装也很简单: pip install captcha 生成验证码:# -*- coding: utf-8 -*-from captcha.image import ImageCaptcha # pip install captchaimport numpy as n...

2018-01-08 21:51:13 16677 27

转载 torch7 安装中Missing dependencies for nn:moses >= 1错误解决办法

Torch7.0安装步骤(默认安装路径是在home下):git clone https://github.com/torch/distro.git ~/torch --recursivecd ~/torchbash install-deps./install.sh在执行./install.sh时出现Missing dependencies for nn:moses >= 1错误,根据参考文献

2018-01-06 19:32:26 1339

原创 OpenCV-Python 霍夫直线检测-HoughLinesP函数参数

cv2.HoughLines()函数是在二值图像中查找直线,cv2.HoughLinesP()函数可以查找直线段。cv2.HoughLinesP()函数原型:HoughLinesP(image, rho, theta, threshold, lines=None, minLineLength=None, maxLineGap=None) image: 必须是二值图像,推荐使

2018-01-06 19:26:15 75226 11

Tensorflow-Multi-GPU-Training.rar

使用Tensorflow数据并行,多GPU训练的demo。模型是一个image2image的模型,参考了dncnn。训练数据转为TFRecord文件。

2020-07-28

pytorch训练图像分类模型pth转ONNX并测试

1. 搭建自己的简单二分类网络,使用pytorch训练和测试; 2. 将pytorch训练的pth模型转换成ONNX,并编码测试; 3. 含训练和测试数据,含训练ok的pth模型和ONNX模型,含完整python和C++实现; 4. 使用方法:首先运行“TrainTestConvertOnnx.py”执行“训练数据读入、模型训练、模型测试、导出onnx”,再运行“TestOnnx.cpp”测试onnx(需要配置OpenCV);

2019-10-29

基于生成对抗网络的图像去模糊

1. 根据给定的模糊图像生成视觉上完整并且统计上一致的去模糊图像,提升模糊图像的清晰度,使用生成性对抗网络(GAN)为基础的深度学习架构; 2. 含训练数据、训练代码以及测试样例,基于keras框架。

2018-08-22

Tensorflow训练的角度检测Resnet模型

Tensorflow训练的角度检测Resnet模型,分为4个分类,用来检测文本角度

2018-05-24

SqueezeNet模型文件及使用

SqueezeNet是一个小型化的网络模型结构,在保证不降低检测精度的同时,将原始AlexNet模型压缩至原来的1/500(模型文件< 0.5MB,原始AlexNet模型约为200MB)。

2018-03-15

Tensorflow文字定位、tesseract识别

Tensorflow文字定位、tesseract识别

2018-02-13

CNN+GRU+CTC不定长中文识别模型训练和测试

Keras训练CNN+GRU+CTC不定长中文识别模型工程代码,含模型文件

2018-02-10

tensorflow训练的识别验证码模型

注意:本资源是文章“tensorflow训练验证码识别模型”(https://blog.csdn.net/dcrmg/article/details/79005532#comments)的示例模型,分享的目的仅仅是为了让整个训练测试流程可以跑通,不保证准确率!不保证准确率!不保证准确率!训练流程都懒得跑一下,只想着下载别人一个模型可以打天下的伸手党请绕道!!! 以下是原始说明: 用tensorflow训练的识别数字验证码的模型,包括checkpoint、crack_capcha.model-1600.data-00000-of-00001、crack_capcha.model-1600.index和crack_capcha.model-1600.meta 共4个文件

2018-01-08

python中xlutils模块(版本2.0)

python中生成一个xls/xlsm文件使用xlwt模块,读取本地的xls文件使用xlrd模块; xlutils模块实现读取本地的xls文件并编辑后保存回本地的功能,是xlrd和xlwt两个模块的桥梁。

2017-10-26

jTessBoxEditorFx-2.0-Beta part2(part1&&part2;)

jTessBoxEditorFx-2.0-Beta 第二部分,共两个部分,jTessBoxEditor用于tesseract字符样本训练过程中合并图片和调整 .box 训练文件;支持中文字符编辑和训练

2017-10-14

jTessBoxEditorFx-2.0-Beta part1(part1&&part2;)

jTessBoxEditor2.0 Fx版本,用于tesseract训练中合并训练图片和 .box 文件调整。支持中文编辑,第一部分,共两个部分

2017-10-14

Windows平台下 Java运行时环境(虚拟机)安装包javaSetup8u144.exe

Windows平台下 Java运行时环境(虚拟机)安装包javaSetup8u144.exe

2017-10-14

tesseract简体中文语言包chi_sim.traineddata

tesseract简体中文识别包chi_sim.traineddata文件,不用提醒说要把文件放到...\Tesseract-OCR\tessdata\文件下吧? 聪明的你可以在这里免费下到tesseract所有的语言包:https://github.com/tesseract-ocr/tessdata/find/master

2017-10-14

Windows下Tesseract 4.0安装包

Windows平台下tesseract4.0版本安装包,无意收分,无奈平台规定最少2分,无分的同学可以去这里下载,一样一样的~~~ http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe

2017-10-14

图片标注工具LabelImg v1.3.3

LabelImg_win版用于图片标注,可方便创建自己的数据集,方便进行深度学习训练。这个是WINDOWS平台版本不需编译。

2017-09-12

张正友相机标定Opencv实现(完整程序+棋盘图)实例源码

张正友相机标定Opencv实现,附棋盘图和14张不同角度标定图。 包含完整的工程代码,有详细的注释说明,一键运行。实现了相机标定、输出相机内参、外参、旋转和平移矩阵、标定效果评价、以及使用标定结果对原始棋盘图进行矫正。

2016-10-26

贪吃蛇小游戏实现

贪吃蛇游戏,C++、Opencv实现 设计思路: 1.显示初始画面,蛇头box初始位置为中心,食物box位置随机 2.按随机方向移动蛇头,按a、s、d、w键控制移动方向,分别为向左,向下,向右,向上 3.蛇头位置与食物box位置重合,则把食物box加入到蛇身向量arraryBox里,并设置食物box为第一个元素 4.蛇身各个box移动规律是,每次移动后一个box的位置变为前一个box的位置 5.蛇头移动超越边界,游戏结束

2016-08-01

90年代经典“手游”—拼图板小游戏Opencv实现

Opencv通过模板匹配和鼠标响应函数实现90年代风靡全国小盆友的经典“手游”拼图板小游戏,类似于Windows 7自带小工具“图片拼图板”,支持设置拼图板的行数和列数,有兴趣可以下载来玩一玩

2016-07-29

直方图反向投影的肤色检测

肤色检测的基本步骤: 1.截取一部分肤色区域,作为检测目标的样本; 2.对样本做直方图计算,并归一化直方图; 3.利用归一化后的直方图,通过calcBackProject函数在原图像中检索,与样本具有表现一致的直方图区域将会被作为肤色检测出来;

2016-07-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除