-牧野--CSDN博客

转载 CNN 模型压缩与加速算法综述

原文链接： https://cloud.tencent.com/developer/article/1005738导语：卷积神经网络日益增长的深度和尺寸为深度学习在移动端的部署带来了巨大的挑战，CNN模型压缩与加速成为了学术界和工业界都重点关注的研究领域之一。前言自从AlexNet一举夺得ILSVRC 2012 ImageNet图像分类竞赛的冠军后，卷积神经网络（CNN）的热潮便席卷了整个计算机视...

2018-03-22 09:09:38 592

原创 VMware 虚拟机快照、克隆、磁盘扩容

1. 快照快照是虚拟机某个时间点上完整系统的镜像，可以在虚拟机内部通过快照文件恢复系统到之前的节点。拍摄快照：恢复快照：2. 克隆克隆是原始虚拟机全部状态的一个拷贝，是脱离原始虚拟机独立存在的，可以在宿主机或其他机器上通过克隆文件创建一个完全独立的虚拟机。3. 虚拟机磁盘扩容磁盘扩容注意，一是虚拟机上不能有快照存在，二是虚拟机必须是关闭状态。扩容操作：在虚拟机设置里扩展磁盘空间之后，虚拟机还不能真...

2018-03-21 13:05:59 16329 1

原创 ubuntu16.04安装Nvidia显卡驱动、CUDA8.0和cudNN V6

Nvidia显卡驱动安装在ubuntu搜索框输入软件更新，打开 "软件和更新" 对话框，在附加驱动里选择系统检测到的Nvidia驱动，应用更改，重启系统：安装完成之后查看GPU驱动版本以及相关信息：nvidia-smi或者使用另一个指令也可以查看GPU驱动版本：cat /proc/driver/nvidia/versionCUDA 8.0 安装1. 检查GPU是否可以装CUDAlspci | ...

2018-03-21 06:00:39 5160 1

原创 ubuntu安装 tensorflow GPU

安装支持GPU的tensorflow前提是正确安装好了 CUDA 和 cuDNN。 CUDA 和 cuDNN的安装见 Nvidia 官网和各种安装教程，应该很容易，重点是要选准了支持自己GPU的 CUDA 版本，再选准支持该 CUDA 版本的 cuDNN版本。关于CUDA：tensorflow-gpu 1.5 及以上版本要求 CUDA 版本为9.0;如果本机装的 CUDA版本是8，安装了 ten...

2018-03-19 08:13:25 5365

原创 Win10安装Ubuntu16.04 双系统

Tips：双系统Ubuntu可以使用机器的GPU硬件，虚拟机不可以压缩卷留的空间尽量大一点，不要相信50G够用选UEFI，并关闭 Secure Boot，不要选 Legacy选UEFI，就要在 UEFI OPTIONS 里启动U盘注意分区挂载1. 准备Ubuntu16.04 LTS： https://www.ubuntu.com/download/desktopUItralSO 软碟通： htt...

2018-03-18 15:37:47 15247 1

原创 python使用wget下载网络文件

wget是一个从网络上自动下载文件的自由工具。它支持HTTP，HTTPS和FTP协议，可以使用HTTP代理。ubuntu 安装wgetpip install wget从网络或本地硬盘下载文件（并解压）# -*- coding: utf-8 -*-import wget, tarfileimport os# 网络地址DATA_URL = 'http://www.robots.ox.ac....

2018-03-16 13:24:49 38836 4

转载文字检测与识别资源

原文链接： http://blog.csdn.net/PeaceInMind/article/details/51387367本文写成时主要参考了[1,2], 后面加了一些自己收集的，不过大家都在更新，所以区别不是很大~综述[2015-PAMI-Overview]Text Detection and Recognition in Imagery: A Survey[paper] [2014-Fr...

2018-03-15 21:21:11 2065 1

转载 10大深度学习架构：计算机视觉优秀从业者必备

选自Analytics Vidhya机器之心编译参与：路雪、李亚洲、黄小天近日，Faizan Shaikh 在 Analytics Vidhya 发表了一篇题为《10 Advanced Deep Learning Architectures Data Scientists Should Know!》的文章，总结了计算机视觉领域已经成效卓著的 10 个深度学习架构，并附上了每篇论文的地址链接和代码实...

2018-03-15 12:16:41 1178

原创 keras channels_last、preprocess_input、全连接层Dense、SGD优化器、模型及编译

channels_last 和 channels_firstkeras中 channels_last 和 channels_first 用来设定数据的维度顺序（image_data_format）。对2D数据来说，"channels_last"假定维度顺序为 (rows,cols,channels)，而"channels_first"假定维度顺序为(channels, rows, cols)。对...

2018-03-14 20:34:52 15698

原创 Web框架Django

Django是一个开放源代码的Web应用框架，由Python写成。1. Ubuntu Django安装：pip install django2. django-admin.py创建一个项目django-admin.py 是django的管理工具，使用 django-admin.py 可以方便的创建项目，创建一个名称为HelloWorld的项目：django-admin.py startprojec...

2018-03-13 21:40:34 680

原创 python sys.path.append()和sys.path.insert()

python程序中使用 import XXX 时，python解析器会在当前目录、已安装和第三方模块中搜索 xxx，如果都搜索不到就会报错。使用sys.path.append()方法可以临时添加搜索路径，方便更简洁的import其他包和模块。这种方法导入的路径会在python程序退出后失效。1. 加入上层目录和绝对路径import syssys.path.append('..') #表示导入当前...

2018-03-13 21:26:20 59920 1

原创 python使用progressbar显示进度条

progressbar安装：pip install progressbar用法一# -*- coding=utf-8 -*-import timefrom progressbar import *total = 1000def dosomework(): time.sleep(0.01)progress = ProgressBar()for i in progress(...

2018-03-12 12:26:17 61352 4

原创 pytorch在CPU和GPU上加载模型

pytorch允许把在GPU上训练的模型加载到CPU上，也允许把在CPU上训练的模型加载到GPU上。CPU->CPU,GPU->GPUtorch.load('gen_500000.pkl')GPU->CPUtorch.load('gen_500000.pkl', map_location=lambda storage, loc: storage)或：to...

2018-03-10 09:00:18 27552 5

原创 vi和vim

vi是UNIX操作系统和类UNIX操作系统中通用的全屏幕纯文本编辑器，vim是vi的升级版，兼容vi，功能更丰富。vi/vim分为三种工作模式：命令模式（Command mode）输入模式（插入模式）（Insert mode）底线命令模式（Last line mode）命令模式启动vi/vim即进入了命令模式，这种模式下输入会被认为是命令，而不是输入字符。命令模式下常用命令：1. 敲下 i ，切换...

2018-03-09 22:25:57 593

原创 python中处理命令行参数的模块optpars

optpars是python中用来处理命令行参数的模块，可以自动生成程序的帮助信息，功能强大，易于使用，可以方便的生成标准的，符合Unix/Posix 规范的命令行说明。使用 add_option() 来加入选项，使用 parse_args() 来解析命令行。add_option()中参数第一个参数表示option的缩写，以单个中划线引导，例如-f、-d，只能用单个字母，可以使用大写;第二个参数表...

2018-03-09 12:32:19 2112

原创 mstsc Windows局域网内远程桌面连接

1.检查被连接计算机的远程桌面连接功能是否开启控制面板->系统和安全->系统->远程设置->远程桌面->勾选“仅允许运行使用网络级别身份验证的远程桌面的计算机连接”。也可以直接在“计算机”右键“属性”直接打开“系统”。 2. 开启防火墙并允许远程桌面控制面板->系统和安全->Windows防火墙->自定义设置->启动Windows防火墙...

2018-03-09 12:00:45 3893

原创显卡、显卡驱动、显存、GPU、CUDA、cuDNN

显卡Video card，Graphics card，又叫显示接口卡，是一个硬件概念（相似的还有网卡），执行计算机到显示设备的数模信号转换任务，安装在计算机的主板上，将计算机的数字信号转换成模拟信号让显示器显示出来。显卡是计算机的标配之一，计算机要显示图像就必须安装显卡。普通计算机的显卡一般是集成在主板上的。显卡驱动显卡驱动是显卡跟计算机连接的桥梁，可以让计算机识别到GPU硬件，是必须正确安装...

2018-03-07 13:09:05 2407

原创 ubuntu创建Centos7镜像&&配置运行环境

1. 下载centos7镜像sudo docker pull centos:72. 启动centos7容器并挂载本地目录sudo docker -it -v /home/software:/home/package centos:7 /bin/bash3. 安装Anacondabash Anaconda2-4.4.0-Linux-x86_64.sh4. 安装Opencvconda install ...

2018-03-06 19:36:42 1765

原创 Docker及常用操作

镜像、容器和仓库Docker镜像：镜像是一个只读的模板，可以用来创建Docker容器。可以直接创建一个镜像，或者是更新已有镜像，或者复制他人的镜像直接使用。Docker容器：容器是镜像的实例，用来执行各种应用，可以同时启动多个容器，相互之间是隔离的。Docker仓库：仓库用来集中存放镜像文件。仓库可以分为公开仓库和私有仓库，Docker Hub是最大的公开仓库，用户可以在本地网络创建一个私有...

2018-03-01 22:03:09 1225

原创 ubuntu在anaconda2下安装anaconda3环境 && 在Pycharm中配置Python3

适合在已经装有anaconda2环境的机器上配置anaconda3环境(或在有anaconda3的环境下再配置2)。1. 下载 anaconda3下载地址：推荐清华镜像 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/2. 安装anaconda3环境py3是将会在目录 '～/anaconda2/envs/'下创建的文件夹名称，...

2018-02-12 19:04:57 1332

原创 Keras GRU 文字识别

GRU（Gated Recurrent Unit）是LSTM的一个变体，也能克服RNN无法很好处理远距离依赖的问题。GRU的结构跟LSTM类似，不过增加了让三个门层也接收细胞状态的输入，是常用的LSTM变体之一。LSTM核心模块：这一核心模块在GRU中变为: CTC网络结构定义：def get_model(height,nclass): input = Input(shap...

2018-02-10 19:18:38 7609 4

原创循环神经网络RNN模型和长短时记忆系统LSTM

传统DNN或者CNN无法对时间序列上的变化进行建模，即当前的预测只跟当前的输入样本相关，无法建立在时间或者先后顺序上出现在当前样本之前或者之后的样本之间的联系。实际的很多场景中，样本出现的时间顺序非常重要，例如自然语言处理、语音识别、手写体识别等应用。循环神经网络RNN包含循环的网络，可以记录信息的持久化信息，特别适合应用在跟时间序列相关的场合。 RNN之父Jürgen

2018-02-06 21:32:09 9128

原创 ResNet网络结构

MSRA（微软亚洲研究院）何凯明团队的深度残差网络（Deep Residual Network）在2015年的ImageNet上取得冠军，该网络简称为ResNet（由算法Residual命名），层数达到了152层，top-5错误率降到了3.57，而2014年冠军GoogLeNet的错误率是6.7。（何凯明博士，2007年清华大学毕业之后开始在微软亚洲研究院（MSRA）实习，2011年香港中文大学博

2018-02-05 19:49:33 29149

原创 VGGNet网络结构

深度神经网络一般由卷积部分和全连接部分构成。卷积部分一般包含卷积（可以有多个不同尺寸的核级联组成）、池化、Dropout等，其中Dropout层必须放在池化之后。全连接部分一般最多包含2到3个全连接，最后通过Softmax得到分类结果，由于全连接层参数量大，现在倾向于尽可能的少用或者不用全连接层。神经网络的发展趋势是考虑使用更小的过滤器，如1*1,3*3等；网络的深度更深（2012年AlenNet

2018-02-05 19:32:37 78121 5

原创神经网络中的Softmax激活函数

Softmax回归模型是logistic回归模型在多分类问题上的推广，适用于多分类问题中，且类别之间互斥的场合。Softmax将多个神经元的输出，映射到（0,1）区间内，可以看成是当前输出是属于各个分类的概率，从而来进行多分类。假设有一个数组V，Vi表示V中的第i个元素，那么Vi元素的softmax值就是：例如 V = [9,6,3,1] , 经

2018-02-03 20:47:26 22618 4

原创 GoogLeNet 神经网络结构

GoogLeNet是2014年 ILSVRC 冠军模型，top-5 错误率 6.7% ，GoogLeNet做了更大胆的网络上的尝试而不像vgg继承了lenet以及alexnet的一些框架，该模型虽然有22层，但参数量只有AlexNet的1/12。GoogLeNet论文指出获得高质量模型最保险的做法就是增加模型的深度（层数）或者是其宽度（层核或者神经元数），但是一般情况下更深或更宽的网络

2018-02-03 20:41:47 14340 4

原创 AlexNet神经网络结构

Alexnet是2012年Imagenet竞赛的冠军模型，准确率达到了57.1%, top-5识别率达到80.2%。 AlexNet包含5个卷积层和3个全连接层，模型示意图：精简版结构： conv1阶段输入数据：227×227×3 卷积核：11×11×3；步长：4；数量（也就是输出个数）：96卷积后数据：55×55×96 （原图N...

2018-02-02 19:24:11 31165 6

原创 Python 字符串相似性的几种度量方法

字符串的相似性比较应用场合很多，像拼写纠错、文本去重、上下文相似性等。评价字符串相似度最常见的办法就是：把一个字符串通过插入、删除或替换这样的编辑操作，变成另外一个字符串，所需要的最少编辑次数，这种就是编辑距离（edit distance）度量方法，也称为Levenshtein距离。海明距离是编辑距离的一种特殊情况，只计算等长情况下替换操作的编辑次数，只能应用于两个等长字符串间的距离度

2018-02-01 19:26:11 23297

原创 Python判断unicode是汉字，数字，英文，或者其他字符

功能：判断unicode是否是汉字，数字，英文，或者是否是（汉字，数字和英文字符之外的）其他字符。全角、半角符号相互转换。全角、半角？全角--指一个字符占用两个标准字符位置。汉字字符和规定了全角的英文字符及国标GB2312-80中的图形符号和特殊字符都是全角字符。一般的系统命令是不用全角字符的，只是在作文字处理时才会使用全角字符。半角

2018-02-01 19:17:41 10550

转载深度学习初学者不可不知的25个术语和概念

知名企业家、同时也是 NBA 小牛队的老板马克·库班（Mark Cuban）曾说过一句话：人工智能，深度学习和机器学习，不论你现在是否能够理解这些概念，你都应该学习。否则三年内，你就会像灭绝的恐龙一样被社会淘汰。马克·库班的这番话乍听起来有些耸人听闻，但仔细想想却不无道理。我们正经历一场大革命，这场革命就是由大数据和强大的电脑计算能力发起的。为了更好地面对和适应这场革命，了解一下相关的概念已经十分

2018-01-31 22:01:58 3973 1

原创卷积神经网络 1*1 卷积核

卷积神经网络中卷积核的作用是提取图像更高维的特征，一个卷积核代表一种特征提取方式，对应产生一个特征图，卷积核的尺寸对应感受野的大小。经典的卷积示意图如下： 5*5的图像使用3*3的卷积核进行卷积，结果产生3*3（5-3+1）的特征图像。卷积核的大小一般是（2n+1）*(2n+1)的奇数乘奇数大小（n>=1），最常用的有3*3,5*5,7*7的。之所有使用奇数*奇

2018-01-31 21:27:39 9361

原创 LeNet-5网络结构及训练参数计算

经典神经网络诞生记： 1、LeNet，1998年　　2、AlexNet，2012年　　3、ZF-net，2013年　　4、GoogleNet，2014年　　5、VGG，2014年　　6、ResNet，2015年LeNet-5LeNet-5是由 Yann LeCun 等人于1998年提出的，是一个用于识别手写数字的网络，其网络结构图如下所示：

2018-01-30 21:09:28 11589 5

原创 Python 把二进制mnist数据库转换为图片

mnist数据库可以通过caffe里的get_mnist.sh文件下载，路径是： caffe-master/data/mnist/get_mnist.sh，get_mnist.sh内容如下：#!/usr/bin/env sh# This scripts downloads the mnist data and unzips it.DIR="$( cd "$(dirname "$0")"

2018-01-29 19:23:03 1663

原创 python 绘图---2D、3D散点图、折线图、曲面图

python中绘制2D曲线图需要使用到Matplotlib，Matplotlib 是一个 Python 的 2D绘图库，它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形，通过 Matplotlib，开发者可以仅需要几行代码，便可以生成绘图，直方图，功率谱，条形图，错误图，散点图等。1. 绘制折线图plt.plot() 可以用于绘制折线图。只传入一维的散点(n个)p1

2018-01-29 11:55:08 54974 3

原创 Pythond 读写HDF5文件

HDF(Hiearchical Data Format)是一种针对大量数据进行组织和存储的文件格式,可以存储不同类型的图像和数码数据的文件格式，并且可以在不同类型的机器上传输。HDF是美国国家高级计算应用中心(National Center for Supercomputing Application,NCSA)为了满足各种领域研究需求而研制的一种能高效存储和分发科学数据的新型数据格式。它的通

2018-01-29 09:35:58 11043 2

原创 Python创建CRNN训练用的LMDB数据库文件

CRNN简介CRNN由 Baoguang Shi, Xiang Bai, Cong Yao提出，2015年7月发表论文：“An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition”，链接地址：https:...

2018-01-26 12:11:49 9457 16

原创 keras 入门模型训练

# -*- coding: utf-8 -*-from keras.models import Sequentialfrom keras.layers import Densefrom keras.models import load_modelimport matplotlib.pyplot as pltimport numpy as npnp.random.seed(1) ...

2018-01-25 21:17:29 1114

原创 Python assert 断言

assert断言语句用来声明某个条件是真的，其作用是测试一个条件(condition)是否成立，如果不成立，则抛出异常。assert一般用法：assert condition如果condition为false，就raise一个AssertionError出来。逻辑上等同于：if not condition: raise AssertionError()

2018-01-25 21:03:15 10424

原创 OpenCV-Python cv2.imdecode()和cv2.imencode() 图片解码和编码

cv2.imdecode()函数从指定的内存缓存中读取数据，并把数据转换(解码)成图像格式;主要用于从网络传输数据中恢复出图像。cv2.imencode()函数是将图片格式转换(编码)成流数据，赋值到内存缓存中;主要用于图像数据格式的压缩，方便网络传输。imdecode()使用从网络读取图像数据并转换成图片格式：# -*- coding: utf-8 -*-i

2018-01-25 20:52:33 170745 20

原创使用Python和OpenCV通过网址URL获取图片

在OpenCV中通过图片的URL地址获取图片：# -*- coding: utf-8 -*-import numpy as npimport urllibimport cv2# URL到图片def url_to_image(url): # download the image, convert it to a NumPy array, and then read

2018-01-25 20:36:34 10874 2

Tensorflow-Multi-GPU-Training.rar

使用Tensorflow数据并行，多GPU训练的demo。模型是一个image2image的模型，参考了dncnn。训练数据转为TFRecord文件。

2020-07-28

pytorch训练图像分类模型pth转ONNX并测试

1. 搭建自己的简单二分类网络，使用pytorch训练和测试； 2. 将pytorch训练的pth模型转换成ONNX，并编码测试； 3. 含训练和测试数据，含训练ok的pth模型和ONNX模型，含完整python和C++实现； 4. 使用方法：首先运行“TrainTestConvertOnnx.py”执行“训练数据读入、模型训练、模型测试、导出onnx”，再运行“TestOnnx.cpp”测试onnx（需要配置OpenCV）；

2019-10-29

基于生成对抗网络的图像去模糊

1. 根据给定的模糊图像生成视觉上完整并且统计上一致的去模糊图像，提升模糊图像的清晰度，使用生成性对抗网络（GAN）为基础的深度学习架构; 2. 含训练数据、训练代码以及测试样例，基于keras框架。

2018-08-22

Tensorflow训练的角度检测Resnet模型

Tensorflow训练的角度检测Resnet模型,分为4个分类，用来检测文本角度

2018-05-24

SqueezeNet模型文件及使用

SqueezeNet是一个小型化的网络模型结构，在保证不降低检测精度的同时，将原始AlexNet模型压缩至原来的1/500（模型文件< 0.5MB,原始AlexNet模型约为200MB）。

2018-03-15

Tensorflow文字定位、tesseract识别

2018-02-13

CNN+GRU+CTC不定长中文识别模型训练和测试

Keras训练CNN+GRU+CTC不定长中文识别模型工程代码，含模型文件

2018-02-10

tensorflow训练的识别验证码模型

注意：本资源是文章“tensorflow训练验证码识别模型”（https://blog.csdn.net/dcrmg/article/details/79005532#comments）的示例模型，分享的目的仅仅是为了让整个训练测试流程可以跑通，不保证准确率！不保证准确率！不保证准确率！训练流程都懒得跑一下，只想着下载别人一个模型可以打天下的伸手党请绕道！！！以下是原始说明：用tensorflow训练的识别数字验证码的模型，包括checkpoint、crack_capcha.model-1600.data-00000-of-00001、crack_capcha.model-1600.index和crack_capcha.model-1600.meta 共4个文件

2018-01-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Tensorflow-Multi-GPU-Training.rar

pytorch训练图像分类模型pth转ONNX并测试

基于生成对抗网络的图像去模糊

Tensorflow训练的角度检测Resnet模型

SqueezeNet模型文件及使用

Tensorflow文字定位、tesseract识别

CNN+GRU+CTC不定长中文识别模型训练和测试

tensorflow训练的识别验证码模型

python中xlutils模块(版本2.0）

jTessBoxEditorFx-2.0-Beta part2（part1&&part2;）

jTessBoxEditorFx-2.0-Beta part1（part1&&part2;）

Windows平台下 Java运行时环境（虚拟机）安装包javaSetup8u144.exe

tesseract简体中文语言包chi_sim.traineddata

Windows下Tesseract 4.0安装包

图片标注工具LabelImg v1.3.3

张正友相机标定Opencv实现（完整程序+棋盘图）实例源码

贪吃蛇小游戏实现

90年代经典“手游”—拼图板小游戏Opencv实现

直方图反向投影的肤色检测

空空如也