自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (19)
  • 收藏
  • 关注

原创 ubuntu在anaconda2下安装anaconda3环境 && 在Pycharm中配置Python3

适合在已经装有anaconda2环境的机器上配置anaconda3环境(或在有anaconda3的环境下再配置2)。1. 下载 anaconda3下载地址: 推荐清华镜像      https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/2. 安装anaconda3环境py3是将会在目录 '~/anaconda2/envs/'下创建的文件夹名称,...

2018-02-12 19:04:57 1330

原创 Keras GRU 文字识别

GRU(Gated Recurrent Unit)是LSTM的一个变体,也能克服RNN无法很好处理远距离依赖的问题。GRU的结构跟LSTM类似,不过增加了让三个门层也接收细胞状态的输入,是常用的LSTM变体之一。LSTM核心模块:这一核心模块在GRU中变为:    CTC网络结构定义:def get_model(height,nclass): input = Input(shap...

2018-02-10 19:18:38 7603 4

原创 循环神经网络RNN模型和长短时记忆系统LSTM

传统DNN或者CNN无法对时间序列上的变化进行建模,即当前的预测只跟当前的输入样本相关,无法建立在时间或者先后顺序上出现在当前样本之前或者之后的样本之间的联系。实际的很多场景中,样本出现的时间顺序非常重要,例如自然语言处理、语音识别、手写体识别等应用。循环神经网络RNN包含循环的网络,可以记录信息的持久化信息,特别适合应用在跟时间序列相关的场合。 RNN之父Jürgen

2018-02-06 21:32:09 9122

原创 ResNet网络结构

MSRA(微软亚洲研究院)何凯明团队的深度残差网络(Deep Residual Network)在2015年的ImageNet上取得冠军,该网络简称为ResNet(由算法Residual命名),层数达到了152层,top-5错误率降到了3.57,而2014年冠军GoogLeNet的错误率是6.7。(何凯明博士,2007年清华大学毕业之后开始在微软亚洲研究院(MSRA)实习,2011年香港中文大学博

2018-02-05 19:49:33 29137

原创 VGGNet网络结构

深度神经网络一般由卷积部分和全连接部分构成。卷积部分一般包含卷积(可以有多个不同尺寸的核级联组成)、池化、Dropout等,其中Dropout层必须放在池化之后。全连接部分一般最多包含2到3个全连接,最后通过Softmax得到分类结果,由于全连接层参数量大,现在倾向于尽可能的少用或者不用全连接层。神经网络的发展趋势是考虑使用更小的过滤器,如1*1,3*3等;网络的深度更深(2012年AlenNet

2018-02-05 19:32:37 78104 5

原创 神经网络中的Softmax激活函数

Softmax回归模型是logistic回归模型在多分类问题上的推广,适用于多分类问题中,且类别之间互斥的场合。Softmax将多个神经元的输出,映射到(0,1)区间内,可以看成是当前输出是属于各个分类的概率,从而来进行多分类。假设有一个数组V,Vi表示V中的第i个元素,那么Vi元素的softmax值就是:例如 V = [9,6,3,1] , 经

2018-02-03 20:47:26 22560 4

原创 GoogLeNet 神经网络结构

GoogLeNet是2014年 ILSVRC 冠军模型,top-5 错误率 6.7% ,GoogLeNet做了更大胆的网络上的尝试而不像vgg继承了lenet以及alexnet的一些框架,该模型虽然有22层,但参数量只有AlexNet的1/12。GoogLeNet论文指出获得高质量模型最保险的做法就是增加模型的深度(层数)或者是其宽度(层核或者神经元数),但是一般情况下更深或更宽的网络

2018-02-03 20:41:47 14322 4

原创 AlexNet神经网络结构

 Alexnet是2012年Imagenet竞赛的冠军模型,准确率达到了57.1%, top-5识别率达到80.2%。 AlexNet包含5个卷积层和3个全连接层,模型示意图: 精简版结构: conv1阶段  输入数据:227×227×3 卷积核:11×11×3;步长:4;数量(也就是输出个数):96卷积后数据:55×55×96  (原图N...

2018-02-02 19:24:11 31152 6

原创 Python 字符串相似性的几种度量方法

字符串的相似性比较应用场合很多,像拼写纠错、文本去重、上下文相似性等。评价字符串相似度最常见的办法就是:把一个字符串通过插入、删除或替换这样的编辑操作,变成另外一个字符串,所需要的最少编辑次数,这种就是编辑距离(edit distance)度量方法,也称为Levenshtein距离。海明距离是编辑距离的一种特殊情况,只计算等长情况下替换操作的编辑次数,只能应用于两个等长字符串间的距离度

2018-02-01 19:26:11 23294

原创 Python判断unicode是汉字,数字,英文,或者其他字符

功能:判断unicode是否是汉字,数字,英文,或者是否是(汉字,数字和英文字符之外的)其他字符。全角、半角符号相互转换。全角、半角?全角--指一个字符占用两个标准字符位置。汉字字符和规定了全角的英文字符及国标GB2312-80中的图形符号和特殊字符都是全角字符。一般的系统命令是不用全角字符的,只是在作文字处理时才会使用全角字符。半角

2018-02-01 19:17:41 10548

Tensorflow-Multi-GPU-Training.rar

使用Tensorflow数据并行,多GPU训练的demo。模型是一个image2image的模型,参考了dncnn。训练数据转为TFRecord文件。

2020-07-28

pytorch训练图像分类模型pth转ONNX并测试

1. 搭建自己的简单二分类网络,使用pytorch训练和测试; 2. 将pytorch训练的pth模型转换成ONNX,并编码测试; 3. 含训练和测试数据,含训练ok的pth模型和ONNX模型,含完整python和C++实现; 4. 使用方法:首先运行“TrainTestConvertOnnx.py”执行“训练数据读入、模型训练、模型测试、导出onnx”,再运行“TestOnnx.cpp”测试onnx(需要配置OpenCV);

2019-10-29

基于生成对抗网络的图像去模糊

1. 根据给定的模糊图像生成视觉上完整并且统计上一致的去模糊图像,提升模糊图像的清晰度,使用生成性对抗网络(GAN)为基础的深度学习架构; 2. 含训练数据、训练代码以及测试样例,基于keras框架。

2018-08-22

Tensorflow训练的角度检测Resnet模型

Tensorflow训练的角度检测Resnet模型,分为4个分类,用来检测文本角度

2018-05-24

SqueezeNet模型文件及使用

SqueezeNet是一个小型化的网络模型结构,在保证不降低检测精度的同时,将原始AlexNet模型压缩至原来的1/500(模型文件< 0.5MB,原始AlexNet模型约为200MB)。

2018-03-15

Tensorflow文字定位、tesseract识别

Tensorflow文字定位、tesseract识别

2018-02-13

CNN+GRU+CTC不定长中文识别模型训练和测试

Keras训练CNN+GRU+CTC不定长中文识别模型工程代码,含模型文件

2018-02-10

tensorflow训练的识别验证码模型

注意:本资源是文章“tensorflow训练验证码识别模型”(https://blog.csdn.net/dcrmg/article/details/79005532#comments)的示例模型,分享的目的仅仅是为了让整个训练测试流程可以跑通,不保证准确率!不保证准确率!不保证准确率!训练流程都懒得跑一下,只想着下载别人一个模型可以打天下的伸手党请绕道!!! 以下是原始说明: 用tensorflow训练的识别数字验证码的模型,包括checkpoint、crack_capcha.model-1600.data-00000-of-00001、crack_capcha.model-1600.index和crack_capcha.model-1600.meta 共4个文件

2018-01-08

python中xlutils模块(版本2.0)

python中生成一个xls/xlsm文件使用xlwt模块,读取本地的xls文件使用xlrd模块; xlutils模块实现读取本地的xls文件并编辑后保存回本地的功能,是xlrd和xlwt两个模块的桥梁。

2017-10-26

jTessBoxEditorFx-2.0-Beta part2(part1&&part2;)

jTessBoxEditorFx-2.0-Beta 第二部分,共两个部分,jTessBoxEditor用于tesseract字符样本训练过程中合并图片和调整 .box 训练文件;支持中文字符编辑和训练

2017-10-14

jTessBoxEditorFx-2.0-Beta part1(part1&&part2;)

jTessBoxEditor2.0 Fx版本,用于tesseract训练中合并训练图片和 .box 文件调整。支持中文编辑,第一部分,共两个部分

2017-10-14

Windows平台下 Java运行时环境(虚拟机)安装包javaSetup8u144.exe

Windows平台下 Java运行时环境(虚拟机)安装包javaSetup8u144.exe

2017-10-14

tesseract简体中文语言包chi_sim.traineddata

tesseract简体中文识别包chi_sim.traineddata文件,不用提醒说要把文件放到...\Tesseract-OCR\tessdata\文件下吧? 聪明的你可以在这里免费下到tesseract所有的语言包:https://github.com/tesseract-ocr/tessdata/find/master

2017-10-14

Windows下Tesseract 4.0安装包

Windows平台下tesseract4.0版本安装包,无意收分,无奈平台规定最少2分,无分的同学可以去这里下载,一样一样的~~~ http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe

2017-10-14

图片标注工具LabelImg v1.3.3

LabelImg_win版用于图片标注,可方便创建自己的数据集,方便进行深度学习训练。这个是WINDOWS平台版本不需编译。

2017-09-12

张正友相机标定Opencv实现(完整程序+棋盘图)实例源码

张正友相机标定Opencv实现,附棋盘图和14张不同角度标定图。 包含完整的工程代码,有详细的注释说明,一键运行。实现了相机标定、输出相机内参、外参、旋转和平移矩阵、标定效果评价、以及使用标定结果对原始棋盘图进行矫正。

2016-10-26

贪吃蛇小游戏实现

贪吃蛇游戏,C++、Opencv实现 设计思路: 1.显示初始画面,蛇头box初始位置为中心,食物box位置随机 2.按随机方向移动蛇头,按a、s、d、w键控制移动方向,分别为向左,向下,向右,向上 3.蛇头位置与食物box位置重合,则把食物box加入到蛇身向量arraryBox里,并设置食物box为第一个元素 4.蛇身各个box移动规律是,每次移动后一个box的位置变为前一个box的位置 5.蛇头移动超越边界,游戏结束

2016-08-01

90年代经典“手游”—拼图板小游戏Opencv实现

Opencv通过模板匹配和鼠标响应函数实现90年代风靡全国小盆友的经典“手游”拼图板小游戏,类似于Windows 7自带小工具“图片拼图板”,支持设置拼图板的行数和列数,有兴趣可以下载来玩一玩

2016-07-29

直方图反向投影的肤色检测

肤色检测的基本步骤: 1.截取一部分肤色区域,作为检测目标的样本; 2.对样本做直方图计算,并归一化直方图; 3.利用归一化后的直方图,通过calcBackProject函数在原图像中检索,与样本具有表现一致的直方图区域将会被作为肤色检测出来;

2016-07-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除