自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 机器视觉中非常好的github仓库

# AwesomeComputerVision **Multi-Object-Tracking-Paper-List** https://github.com/SpyderXu/multi-object-tracking-paper-list **awesome-object-detecti...

2019-03-13 13:00:42 672 0

原创 ubuntu安装openpose

一、使用Git直接下载openposegit clone https://github.com/CMU-Perceptual-Computing-Lab/openpose.git二、下载各种模型文件(比较大,可能需要几分钟到几个小时不等,看网速了) 进入openpose所在目录 cd models...

2019-01-16 12:21:54 2758 0

原创 用原生Tensorflow编写的Inception-ResNet-V1网络(想了解模型实现细节的看)

# prepare input data IMAGE_HEI = 128 IMAGE_WID = 128 IMAGE_CHA = 3 CLASS_NUM = 2 X = tf.placeholder(tf.float32, [None, IMAGE_HEI, IMAGE_WID, IMAGE_C...

2018-08-15 18:40:18 1230 0

原创 tf.nn.softmax_cross_entropy_with_logits

#coding=utf-8 """ tf.nn.softmax_cross_entropy_with_logits(logits, labels, name=None) 第一个参数logits:就是神经网络最后一层的输出,如果有batch的话, 它的大小就是[batc...

2018-07-06 11:12:39 387 0

翻译 Tensorflow模型预测时,若用CPU计算,如何设置? 并行计算-多核(multicore),多线程(multi-thread)

在标准系统上通常有多个计算设备. TensorFlow 支持 CPU 和 GPU 这两种设备. 用指定字符串来标识这些设备. 比如: "/cpu:0": 机器中的 CPU "/gpu:0": 机器中的 GPU, 如果你有一个的话. "/gpu:1&...

2018-07-05 17:29:25 7449 1

翻译 pip国内镜像

今天傻逼了,准备安装Tensorflow,碰巧网不好,用pip安装时下载很慢, 关键时经常断。pip没有断点续传,一旦断了就前功尽弃。装了好半天,还是 没弄好。后来突然想到pip有没有快点的服务器,一查发现国内镜像很多, 换个地址后,瞬间就下载完毕了。草! --------------- pip国...

2018-07-05 16:59:08 974 0

原创 将voc数据集转换成.tfrecord格式供tensorflow训练用

把现成的东西捋了一遍,主要是我想训练自己想要的模型,格式和分类类别不一样。所以先把VOC捋顺了,为以后改成适合自己的做准备。此处记录一下。就一个文件搞定(现在啥都分布式,读起来费劲)。#coding=utf-8 import os import sys import random import ...

2018-06-08 17:33:22 7782 6

原创 语义分割汇总

[![Awesome](https://cdn.rawgit.com/sindresorhus/awesome/d7305f38d29fed78fa85652e3a63e154dd8e8829/media/badge.svg)](https://github.com/sindresorhus/aw...

2018-05-23 19:26:11 1567 1

原创 Moving Average(移动平均,MA)

移动平均法是用一组最近的实际数据值来预测未来一期或几期内公司产品的需求量、公司产能等的一种常用方法。移动平均法适用于即期预测。当产品需求既不快速增长也不快速下降,且不存在季节性因素时,移动平均法能有效地消除预测中的随机波动,是非常有用的。移动平均法可以分为: 简单移动平均加权移动平均 ...

2018-02-01 13:03:52 2771 1

原创 ResNet

一、综述 ResNet(Residual Networks,残差网络),论文——Deep Residual Learning for Image Recognition(下载地址:https://arxiv.org/pdf/1512.03385.pdf),是MSRA(微软亚洲研究院)的何凯明(ht...

2018-01-31 18:33:31 1134 0

原创 Detectron

Detectron是FAIR(Facebook AI Research)的软件包。其包含了一些了最先进的目标检测算法,例如:Mask R-CNN(Marr Prize at ICCV 2017)。利用Detectron,我们可以快速的实验和评估一些新的想法。Detectron目前包括如下目标检测...

2018-01-23 12:54:51 6748 0

原创 朴素贝叶斯分类(Nave Bayes)

一、条件概率(Conditional probability) 条件概率是指事件A在另外一个事件B已经发生条件下的发生概率,记P(A|B)。举例说明: 上图左边为一个布袋,里边装有5个球,其中2个蓝色球,3个红色球。每次随机从布袋里拿一颗球(不放回),求连续2次拿到篮球的概率是多少...

2017-12-27 14:18:07 24416 6

原创 ORB

一、介绍 假如有两张人物图片,我没的目标是要确认这两张图片中的人物是否是同一个人。如果人来判断,这太简单了。但是让计算机来完成这个功能就困难重重。一种可行的方法是: 分别找出两张图片中的特征点描述这些特征点的属性,比较这两张图片的特征点的属性。如果有足够多的特征点具有相同的属性,那么就可以认为...

2017-12-13 19:09:04 3284 1

原创 检测直线(利用cv::ximgproc::FastLineDetector)

介绍: 在OpenCV3.0 以上版本的contrib模块中,有一个cv::ximgproc::FastLineDetector类。定义位置: // 需要下载contrib模块 opencv_contrib/modules/ximgproc/include/opencv2/ximgproc/f...

2017-12-08 18:56:31 4231 1

翻译 YOLO

一、背景介绍 YOLO(You Only Look Once: Unified, Real-Time Object Detection),论文地址。YOLO是Joseph Redmon和Ali Farhadi等人于2015年提出的基于单个神经网络的目标检测系统。在2017年CVPR上,Joseph...

2017-12-08 10:32:31 21566 1

翻译 Object Proposal(OP)综述

目标检测(object detection),要求模型不仅能判断一幅输入图像中包含哪类目标,还得框出目标的具体位置(bounding box)。 为了实现上述要求,传统的方法是利用滑动窗口(Sliding Window)的方式,用不同尺度(scale)、比例(aspect ratio)的窗口在图...

2017-12-07 13:16:19 6880 1

翻译 选择性搜索(selective search)

该文翻译整理自:selective search for object detection(c++ / python) 一、目标检测 VS 目标识别 目标识别(objec recognition)就是要指出一幅输入图像中包含那类目标。输入时一幅图像,输出是目标属于某个类别的概率(class p...

2017-12-06 15:37:40 46974 14

原创 MeanShift用于彩色图像分割(OpenCV)

一、均值漂移(Mean Shift)算法 Mean Shift算法,一般是指一个迭代的步骤,即先算出当前点的偏移均值,移动该点到其偏移均值,然后以此为新的起始点。继续移动,直到满足一定的条件结束。 Mean Shift向量定义: 上述定义的理解:在d维空间中,任选一个点,然后以这个点为圆心...

2017-12-06 13:55:21 3487 0

原创 基于图的图像分割(Graph-Based Image Segmentation)

一、介绍 基于图的图像分割(Graph-Based Image Segmentation),论文《Efficient Graph-Based Image Segmentation》,P. Felzenszwalb, D. Huttenlocher,International Journal of ...

2017-12-06 12:34:49 29984 5

原创 主成分分析(principle component analysis)介绍

一、介绍 主成分分析(principal components analysis,PCA)又称主分量分析,主成分回归分析。旨在利用降维的思想,把多指标转化为少数几个综合指标。在统计学中,PCA是一种简化数据集的技术。 它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一...

2017-12-04 17:28:37 9077 0

翻译 正则化(regularization)

一、过拟合(overfitting)问题 上图是房价(Price)与房子面积(Size)的关系的实例。我们的目标是利用多项式回归来根据房子面积来预测房价。 左边的模型仅用了一次项,此时模型参数有俩θ0、θ1,是一天直线;直观的观察样本点(红色×)的趋势,我们发现该模型并不能很好的拟合两者的关系...

2017-11-29 17:54:18 11279 0

原创 TensorFlow训练的模型参数(W和B)利用np.savez()保存和用cnpy库C++读取

一、背景 大家经常会在Python环境下用TensorFlow训练自己的深度学习模型。为了日后能够使用训练好的模型,在Python环境下,TensorFlow提供了 tf.train.Saver类,用来保存模型。这个类提供了一整套函数用于方便的存储和恢复模型! 但实际情况是:大多数人会用Pytho...

2017-11-22 19:25:43 1947 0

原创 多项式回归(polynomial regression)转换为线性回归(linear regression)

一、介绍 一元m次多项式回归方程: 二元二次多项式回归方程: 多元多次的多项式回归方程较复杂,加之实际生产生活中一元m次多项式归回就已经能够解决了,所以略! 对于一元m次多项式回归方程,令: 则该一元m次多项式就转化为m元线性回归方程: 因此,用多元线性函数的回归方法就可解...

2017-11-16 17:26:09 7432 2

原创 TensorFlow tf.nn.conv2d()介绍

一、tf.nn.conv2d()函数python版本的定义: tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)1、参数 input: 需要做卷积的输入图像,是一个Tensor,shape为...

2017-11-01 15:04:30 855 0

翻译 BN算法

2015年的论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》阐述了BN算法,这个算法目前已经被大量应用,很多论文都会引用这个算法,进行网络训练,可见其强大...

2017-10-31 16:09:10 6955 0

翻译 CNN中1×1的卷积核的作用

1×1卷积核最早引起人们的重视是在NIN《Min Lin, Qiang Chen, and Shuicheng Yan. Network in network. CoRR, abs/1312.4400, 2013》结构中,后来在GoogLeNet的Inception结构中用于降维。 1×1卷积核...

2017-10-31 12:04:02 5246 0

翻译 GoogLeNet

GoogLeNet最早出现在2014年的《Going deeper with convolutions》,之所以叫GoogLeNet,而不是GoogleNet,文章说是为了向早期的LeNet致敬。GoogLeNet是谷歌团队为了参加ILSVRC 2014(ImageNet Large Scale...

2017-10-30 17:50:50 4409 2

原创 OpenCV3.3 DNN简介

如今,在机器视觉领域,深度学习已经是最流行且增长最快的一个方向了。OpenCV自3.1版本其就在contrib中加入了DNN模块。到3.3版本时,将DNN模块由contrib提升到了正式代码块中。在住仓库中的位置为:https://github.com/opencv/opencv/tree/mas...

2017-10-26 18:30:46 7241 0

原创 gamma校正(基于OpenCV)

Gamma校正是对输入图像灰度值进行的非线性操作,使输出图像灰度值与输入图像灰度值呈指数关系。 指数γ即为Gamma 经过Gamma校正后的输入和输出图像灰度值关系如下图所示: 横坐标是输入灰度值,纵坐标是输出灰度值,蓝色曲线是gamma值小于1时的输入输出关系,红色曲线...

2017-10-25 18:39:10 1784 0

原创 图像处理中卷积的实现(TensorFlow和OpenCV)

一、用C解释原理 假设图像(宽6高4),一个卷积核(宽3高3),如下: unsigned char src[24] ={ 1,2,3,4,5,6, 1,1,1,1,1,1, 2,1,2,1,2,1, 4,5,6,1,2,3};float kernel[9] = { ...

2017-10-24 10:30:07 1699 0

原创 积分图快速计算

积分图是图像中十分常用的方法,最初是在计算Haar特征值时的快速计算方法,后来在均值滤波,二值化等图像处理方法中也十分常见。积分图的计算原理: C++代码(亲测通过): /****************************************** * 快速计算积分图 * In...

2017-10-23 19:17:25 1271 0

翻译 图像增强:LLNet: A Deep Autoencoder approach to Natural Low-light Image Enhancement介绍

LLNet: A Deep Autoencoder approach to Natural Low-light Image Enhancement(利用深度自编码器对低照度图像进行增强) 一、自编码器网络结构 二、训练过程 三、试验结果 Compar...

2017-10-20 19:12:55 4589 3

翻译 图像的峰值信噪比(peak signal to noise ratio, PSNR)

峰值信噪比(PSNR)是一个表示信号最大可能功率和影响它的表示精度的破坏性噪声功率的比值的工程术语。由于许多信号都有非常宽的动态范围,峰值信噪比常用对数分贝单位来表示。 在图像处理中,要对图像进行客观的评价,常常需要计算PSNR。PSNR是衡量图像失真或是噪声水平的客观标准。2个图像之间PSNR...

2017-10-20 18:51:30 10143 0

翻译 图像自动去暗角算法

暗角图像是一种在现实中较为常见的图像,其主要特征就是在图像四个角有较为显著的亮度下降,比如下面两幅图: 在2014年Y.Zheng等人的《Single image vignetting correction》以及同样有他们撰写的论文《Single image vignetting cor...

2017-10-20 16:04:00 1335 1

翻译 矩阵迹运算

矩阵(方阵)迹运算返回的是矩阵对角元素的和: 迹运算因为很多原因而有用。若使用求和符号,有些矩阵运算很难描述,而通过矩阵乘法和迹运算符号,可以清楚地表示。例如矩阵F-范数(Frobenius norm): 迹运算性质1: 设方阵A,有 迹运算性质2: 多个矩阵相乘得到的方阵的迹,和...

2017-10-20 10:18:36 8259 0

翻译 万能近似定理(universal approximation theorrm)

神经网络的架构(architecture)指网络的整体结构。大多数神经网络被组织成称为层的单元组,然后将这些层布置成链式结构,其中每一层都是前一层的函数。在这种结构中,第一层由下式给出: 第二层: 可以看出,每一层的主体都是线性模型。线性模型,通过矩阵乘法将特征映射到输出,顾名思义,仅能表...

2017-10-19 19:07:17 16823 0

翻译 梯度消失(vanishing gradient)和梯度爆炸(exploding gradient)

神经网络中梯度不稳定的根本原因:在于前层上的梯度的计算来自于后层上梯度的乘积(链式法则)。当层数很多时,就容易出现不稳定。下边3个隐含层为例: 其b1的梯度为: 加入激活函数为sigmoid,则其导数如下图: sigmoid导数σ'的最大值为1/4。同常一个权值w的取值范围为...

2017-10-19 11:47:28 6732 1

翻译 自编码器(auto-encoder)介绍

一、自编码器简介 自编码器可以理解为一个试图还原原始输入的系统,如下图: 上图中,虚线蓝色框内的部分就是一个自编码器模型,它由编码器(Encoder)和解码器(Decoder)组成。本质上是对输入信号做某种变换。编码器将输入信号x变换成编码信号y,而解码器将编码信号y转换成输出信号: ...

2017-10-17 11:55:23 1521 0

转载 深度学习中常见的过拟合方法

过拟合即训练误差很小,而泛化误差很大。在传统的机器学习方法中有多防止过拟合的方法,同样这些方法很多也适合用于深度学习中,同时深度学习中又有一些独特的防止过拟合的方法,下面对其进行简单的梳理。 一、参数范数惩罚 范数正则化是一种非常普遍的方法,也是最常用的方法,假如优化: 其中L为经验风险,...

2017-10-16 11:20:58 2425 0

原创 为什么交叉熵损失可以提高具有sigmoid和softmax输出的模型的性能,而使用均方误差损失则会存在很多问题

一、均方误差的权值更新过程(举例说明) 代价函数经常用方差代价函数(即采用均方误差MSE),比如对于一个神经元(单输入单输出,sigmoid函数),定义其代价函数为: 其中y是我们期望的输出,a为神经元的实际输出【 a=σ(z), where z=wx+b 】。在训练神经网络过程中...

2017-10-16 10:42:08 5368 4

提示
确定要删除当前文章?
取消 删除