guoyunfei20-CSDN博客

原创机器视觉中非常好的github仓库

# AwesomeComputerVision**Multi-Object-Tracking-Paper-List** https://github.com/SpyderXu/multi-object-tracking-paper-list**awesome-object-detection** https://github.com/hoya012/deep_learning_obj...

2019-03-13 13:00:42 1478

原创 ubuntu安装openpose

一、使用Git直接下载openposegit clone https://github.com/CMU-Perceptual-Computing-Lab/openpose.git二、下载各种模型文件（比较大，可能需要几分钟到几个小时不等，看网速了）进入openpose所在目录cd modelssh ./getModels.sh（这个脚本就是用来下载各种已训练的模型的）三、编译Caffe（...

2019-01-16 12:21:54 6305

原创用原生Tensorflow编写的Inception-ResNet-V1网络（想了解模型实现细节的看）

# prepare input dataIMAGE_HEI = 128IMAGE_WID = 128IMAGE_CHA = 3CLASS_NUM = 2X = tf.placeholder(tf.float32, [None, IMAGE_HEI, IMAGE_WID, IMAGE_CHA])Y_= tf.placeholder(tf.float32, [None, CLASS_NU...

2018-08-15 18:40:18 2040

原创 tf.nn.softmax_cross_entropy_with_logits

#coding=utf-8"""tf.nn.softmax_cross_entropy_with_logits(logits, labels, name=None)第一个参数logits：就是神经网络最后一层的输出，如果有batch的话，它的大小就是[batchsize，num_classes]第二个参数labels：实际的标签，大小同上注意:这个函数的返回值并不是一个数，而是一个...

2018-07-06 11:12:39 782

翻译 Tensorflow模型预测时，若用CPU计算，如何设置？并行计算-多核(multicore)，多线程(multi-thread)

在标准系统上通常有多个计算设备.TensorFlow 支持 CPU 和 GPU 这两种设备. 用指定字符串来标识这些设备. 比如:"/cpu:0": 机器中的 CPU"/gpu:0": 机器中的 GPU, 如果你有一个的话."/gpu:1": 机器中的第二个 GPU, 以此类推...在Tensorflow程序中，我们会经常看到 with tf.device("/cpu:0"): 这个语...

2018-07-05 17:29:25 13506 1

翻译 pip国内镜像

今天傻逼了，准备安装Tensorflow，碰巧网不好，用pip安装时下载很慢，关键时经常断。pip没有断点续传，一旦断了就前功尽弃。装了好半天，还是没弄好。后来突然想到pip有没有快点的服务器，一查发现国内镜像很多，换个地址后，瞬间就下载完毕了。草！---------------pip国内的一些镜像:阿里云 http://mirrors.aliyun.com/pypi/simple/ ...

2018-07-05 16:59:08 1368

原创将voc数据集转换成.tfrecord格式供tensorflow训练用

把现成的东西捋了一遍，主要是我想训练自己想要的模型，格式和分类类别不一样。所以先把VOC捋顺了，为以后改成适合自己的做准备。此处记录一下。就一个文件搞定（现在啥都分布式，读起来费劲）。#coding=utf-8import osimport sysimport randomimport numpy as npimport tensorflow as tf# process a xml...

2018-06-08 17:33:22 9953 8

原创语义分割汇总

[![Awesome](https://cdn.rawgit.com/sindresorhus/awesome/d7305f38d29fed78fa85652e3a63e154dd8e8829/media/badge.svg)](https://github.com/sindresorhus/awesome)# Awesome Semantic Segmentation## Network...

2018-05-23 19:26:11 2488 1

原创 Moving Average（移动平均，MA）

移动平均法是用一组最近的实际数据值来预测未来一期或几期内公司产品的需求量、公司产能等的一种常用方法。移动平均法适用于即期预测。当产品需求既不快速增长也不快速下降，且不存在季节性因素时，移动平均法能有效地消除预测中的随机波动，是非常有用的。移动平均法可以分为：简单移动平均加权移动平均简单移动平均：简单移动平均的各元素的权重都相等。简单的移动平均的计算公式如下：

2018-02-01 13:03:52 8294

原创 ResNet

一、综述ResNet（Residual Networks，残差网络），论文——Deep Residual Learning for Image Recognition（下载地址：https://arxiv.org/pdf/1512.03385.pdf），是MSRA（微软亚洲研究院）的何凯明（http://kaiminghe.com/）团队设计的。在2015年ImageNet上大放异彩。在Ima

2018-01-31 18:33:31 1458

原创 Detectron

Detectron是FAIR（Facebook AI Research）的软件包。其包含了一些了最先进的目标检测算法，例如：Mask R-CNN（Marr Prize at ICCV 2017）。利用Detectron，我们可以快速的实验和评估一些新的想法。Detectron目前包括如下目标检测算法：Mask R-CNN -- Marr Prize at ICCV 2017

2018-01-23 12:54:51 7825

原创朴素贝叶斯分类（Nave Bayes）

一、条件概率（Conditional probability）条件概率是指事件A在另外一个事件B已经发生条件下的发生概率，记P（A|B）。举例说明：上图左边为一个布袋，里边装有5个球，其中2个蓝色球，3个红色球。每次随机从布袋里拿一颗球（不放回），求连续2次拿到篮球的概率是多少？非常浅显的一点是——第一次拿球和第二次拿球是相关事件（是有关系的，即不是相互独立的事件）。第一次

2017-12-27 14:18:07 56353 7

原创 ORB

一、介绍假如有两张人物图片，我没的目标是要确认这两张图片中的人物是否是同一个人。如果人来判断，这太简单了。但是让计算机来完成这个功能就困难重重。一种可行的方法是：分别找出两张图片中的特征点描述这些特征点的属性，比较这两张图片的特征点的属性。如果有足够多的特征点具有相同的属性，那么就可以认为两张图片中的人物就是同一个人。ORB（Oriented FAST and Rotate

2017-12-13 19:09:04 7279 1

原创检测直线（利用cv::ximgproc::FastLineDetector）

介绍：在OpenCV3.0 以上版本的contrib模块中，有一个cv::ximgproc::FastLineDetector类。定义位置：// 需要下载contrib模块opencv_contrib/modules/ximgproc/include/opencv2/ximgproc/fast_line_detector.hpp所谓Fast，是相对于正式模块中的cv::imgproc::

2017-12-08 18:56:31 12793 2

翻译 YOLO

一、背景介绍YOLO（You Only Look Once: Unified, Real-Time Object Detection），论文地址。YOLO是Joseph Redmon和Ali Farhadi等人于2015年提出的基于单个神经网络的目标检测系统。在2017年CVPR上，Joseph Redmon和Ali Farhadi又发表的YOLO 2，进一步提高了检测的精度和速度。本博仅学习

2017-12-08 10:32:31 24052

翻译 Object Proposal（OP）综述

目标检测（object detection），要求模型不仅能判断一幅输入图像中包含哪类目标，还得框出目标的具体位置（bounding box）。为了实现上述要求，传统的方法是利用滑动窗口（Sliding Window）的方式，用不同尺度（scale）、比例（aspect ratio）的窗口在图像上滑动，穷举出所有可能位置上的子图像块。然后再将这些子图像块输入到目标识别（object recog

2017-12-07 13:16:19 14252 1

翻译选择性搜索（selective search）

该文翻译整理自：selective search for object detection（c++ / python）一、目标检测 VS 目标识别目标识别（objec recognition）就是要指出一幅输入图像中包含那类目标。输入时一幅图像，输出是目标属于某个类别的概率（class probability）。而目标检测（object detection）除了要告诉输入图像中包含

2017-12-06 15:37:40 67484 17

原创 MeanShift用于彩色图像分割（OpenCV）

一、均值漂移（Mean Shift）算法Mean Shift算法，一般是指一个迭代的步骤，即先算出当前点的偏移均值，移动该点到其偏移均值，然后以此为新的起始点。继续移动，直到满足一定的条件结束。Mean Shift向量定义：上述定义的理解：在d维空间中，任选一个点，然后以这个点为圆心，h为半径做一个高维球，因为有d维，d可能大于2，所以是高维球。落在这个球内的所有点和圆

2017-12-06 13:55:21 6295

原创基于图的图像分割（Graph-Based Image Segmentation）

一、介绍基于图的图像分割（Graph-Based Image Segmentation），论文《Efficient Graph-Based Image Segmentation》，P. Felzenszwalb, D. Huttenlocher，International Journal of Computer Vision, Vol. 59, No. 2, September 2004论

2017-12-06 12:34:49 44308 12

原创主成分分析（principle component analysis）介绍

一、介绍主成分分析（principal components analysis，PCA）又称主分量分析，主成分回归分析。旨在利用降维的思想，把多指标转化为少数几个综合指标。在统计学中，PCA是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中，使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上，第二大方差在第二个坐标(第二主成分)上，依次类推。主成

2017-12-04 17:28:37 21800

翻译正则化（regularization）

一、过拟合（overfitting）问题上图是房价（Price）与房子面积（Size）的关系的实例。我们的目标是利用多项式回归来根据房子面积来预测房价。左边的模型仅用了一次项，此时模型参数有俩θ0、θ1，是一天直线；直观的观察样本点（红色×）的趋势，我们发现该模型并不能很好的拟合两者的关系（很明显，随着房子面积增大，住房价格的变化趋于稳定或者说越往右越平缓）。此类情况称为欠拟合（u

2017-11-29 17:54:18 16072

原创 TensorFlow训练的模型参数（W和B）利用np.savez()保存和用cnpy库C++读取

一、背景大家经常会在Python环境下用TensorFlow训练自己的深度学习模型。为了日后能够使用训练好的模型，在Python环境下，TensorFlow提供了tf.train.Saver类，用来保存模型。这个类提供了一整套函数用于方便的存储和恢复模型！但实际情况是：大多数人会用Python环境下TensorFlow训练模型，而在实际的预测任务时，希望用C/C++语言来实现模型并加载

2017-11-22 19:25:43 3451

原创多项式回归（polynomial regression）转换为线性回归（linear regression）

一、介绍一元m次多项式回归方程：二元二次多项式回归方程：多元多次的多项式回归方程较复杂，加之实际生产生活中一元m次多项式归回就已经能够解决了，所以略！对于一元m次多项式回归方程，令：则该一元m次多项式就转化为m元线性回归方程：因此，用多元线性函数的回归方法就可解决多项式回归问题！需要指出的是，在多项式回归分析中，检验回归系数是

2017-11-16 17:26:09 14260 3

原创 TensorFlow tf.nn.conv2d()介绍

一、tf.nn.conv2d()函数python版本的定义：tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)1、参数 input：需要做卷积的输入图像，是一个Tensor，shape为[batch, in_height, in_width, in_channels]，含义是[训练时

2017-11-01 15:04:30 1941

翻译 BN算法

2015年的论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》阐述了BN算法，这个算法目前已经被大量应用，很多论文都会引用这个算法，进行网络训练，可见其强大之处非同一般。在深度学习中，随机梯度下降已经成为主要的训练方法。尽管随机梯度下降法对于训练深度网络

2017-10-31 16:09:10 10368

翻译 CNN中1×1的卷积核的作用

1×1卷积核最早引起人们的重视是在NIN《Min Lin, Qiang Chen, and Shuicheng Yan. Network in network. CoRR, abs/1312.4400, 2013》结构中，后来在GoogLeNet的Inception结构中用于降维。1×1卷积核用于升维、降维如果卷积的输入、输出都仅有一个平面，那么1×1卷积核并没有啥意义。它完全不考虑像

2017-10-31 12:04:02 8010

翻译 GoogLeNet

GoogLeNet最早出现在2014年的《Going deeper with convolutions》，之所以叫GoogLeNet，而不是GoogleNet，文章说是为了向早期的LeNet致敬。GoogLeNet是谷歌团队为了参加ILSVRC 2014（ImageNet Large Scale Visual Recognition Challenge）比赛而精心准备的。GoogLeNet,在

2017-10-30 17:50:50 11354 2

原创 OpenCV3.3 DNN简介

如今，在机器视觉领域，深度学习已经是最流行且增长最快的一个方向了。OpenCV自3.1版本其就在contrib中加入了DNN模块。到3.3版本时，将DNN模块由contrib提升到了正式代码块中。在住仓库中的位置为：https://github.com/opencv/opencv/tree/master/modules/dnn。同时相较于3.1版本，3.3版本对DNN做了很大改进！该DNN模块

2017-10-26 18:30:46 8796

原创 gamma校正（基于OpenCV）

Gamma校正是对输入图像灰度值进行的非线性操作，使输出图像灰度值与输入图像灰度值呈指数关系。指数γ即为Gamma经过Gamma校正后的输入和输出图像灰度值关系如下图所示：横坐标是输入灰度值，纵坐标是输出灰度值，蓝色曲线是gamma值小于1时的输入输出关系，红色曲线是gamma值大于1时的输入输出关系。可以观察到，当gamma值小于1时(蓝色曲线)，图像的整体亮

2017-10-25 18:39:10 2748

原创图像处理中卷积的实现（TensorFlow和OpenCV）

一、用C解释原理假设图像（宽6高4），一个卷积核（宽3高3），如下：unsigned char src[24] ={ 1,2,3,4,5,6, 1,1,1,1,1,1, 2,1,2,1,2,1, 4,5,6,1,2,3};float kernel[9] = { -1., 0., 1., -2., 0., 2., -3., 0., 3

2017-10-24 10:30:07 2542

原创积分图快速计算

积分图是图像中十分常用的方法，最初是在计算Haar特征值时的快速计算方法，后来在均值滤波，二值化等图像处理方法中也十分常见。积分图的计算原理：C++代码（亲测通过）：/******************************************* 快速计算积分图* Integral(i,j) = Integral(i,j-1) + Integral(i-1,j) - I

2017-10-23 19:17:25 2021

翻译图像增强：LLNet: A Deep Autoencoder approach to Natural Low-light Image Enhancement介绍

LLNet: A Deep Autoencoder approach to Natural Low-light Image Enhancement（利用深度自编码器对低照度图像进行增强）一、自编码器网络结构二、训练过程三、试验结果Comparison of methods of enhancing ‘Town’ when applied to

2017-10-20 19:12:55 8714 4

翻译图像的峰值信噪比（peak signal to noise ratio, PSNR）

峰值信噪比（PSNR）是一个表示信号最大可能功率和影响它的表示精度的破坏性噪声功率的比值的工程术语。由于许多信号都有非常宽的动态范围，峰值信噪比常用对数分贝单位来表示。在图像处理中，要对图像进行客观的评价，常常需要计算PSNR。PSNR是衡量图像失真或是噪声水平的客观标准。2个图像之间PSNR值越大，则越相似。普遍基准为30dB，30dB以下的图像劣化较为明显。PSNR定义：其

2017-10-20 18:51:30 21412

翻译图像自动去暗角算法

暗角图像是一种在现实中较为常见的图像，其主要特征就是在图像四个角有较为显著的亮度下降，比如下面两幅图：在2014年Y.Zheng等人的《Single image vignetting correction》以及同样有他们撰写的论文《Single image vignetting correction using radial gradient symmetry》有讲这方面的算法，不过其

2017-10-20 16:04:00 3489 1

翻译矩阵迹运算

矩阵（方阵）迹运算返回的是矩阵对角元素的和：迹运算因为很多原因而有用。若使用求和符号，有些矩阵运算很难描述，而通过矩阵乘法和迹运算符号，可以清楚地表示。例如矩阵F-范数（Frobenius norm）：迹运算性质1：设方阵A，有迹运算性质2：多个矩阵相乘得到的方阵的迹，和将这些矩阵中的最后一个挪到最前面之后相乘的迹是相同的。当然，我们需要考虑挪动

2017-10-20 10:18:36 25801 1

翻译万能近似定理（universal approximation theorrm）

神经网络的架构（architecture）指网络的整体结构。大多数神经网络被组织成称为层的单元组，然后将这些层布置成链式结构，其中每一层都是前一层的函数。在这种结构中，第一层由下式给出：第二层：可以看出，每一层的主体都是线性模型。线性模型，通过矩阵乘法将特征映射到输出，顾名思义，仅能表示线性函数。它具有易于训练的优点，因为当使用线性模型时，许多损失函数会导出凸优化问题。不幸

2017-10-19 19:07:17 42687 2

翻译梯度消失（vanishing gradient）和梯度爆炸（exploding gradient）

神经网络中梯度不稳定的根本原因：在于前层上的梯度的计算来自于后层上梯度的乘积（链式法则）。当层数很多时，就容易出现不稳定。下边3个隐含层为例：其b1的梯度为：加入激活函数为sigmoid，则其导数如下图：sigmoid导数σ'的最大值为1/4。同常一个权值w的取值范围为abs(w) ，则：|wjσ'(zj)| ，从而有：从上式可以得出结论：前层比

2017-10-19 11:47:28 10552

翻译自编码器（auto-encoder）介绍

一、自编码器简介自编码器可以理解为一个试图还原原始输入的系统，如下图：上图中，虚线蓝色框内的部分就是一个自编码器模型，它由编码器（Encoder）和解码器（Decoder）组成。本质上是对输入信号做某种变换。编码器将输入信号x变换成编码信号y，而解码器将编码信号y转换成输出信号：自编码器的目的是让输出仅可能的复现输入。有人会问，如果f和g是恒等映射，那输入不就永远等于输

2017-10-17 11:55:23 2791

转载深度学习中常见的过拟合方法

过拟合即训练误差很小，而泛化误差很大。在传统的机器学习方法中有多防止过拟合的方法，同样这些方法很多也适合用于深度学习中，同时深度学习中又有一些独特的防止过拟合的方法，下面对其进行简单的梳理。一、参数范数惩罚范数正则化是一种非常普遍的方法,也是最常用的方法,假如优化: 其中L为经验风险，其为在训练样本上的误差，而G为对参数的惩罚，也叫结构风险；α是平衡两者，如果太大则对应的惩

2017-10-16 11:20:58 3693

原创为什么交叉熵损失可以提高具有sigmoid和softmax输出的模型的性能，而使用均方误差损失则会存在很多问题

一、均方误差的权值更新过程（举例说明）代价函数经常用方差代价函数（即采用均方误差MSE），比如对于一个神经元（单输入单输出，sigmoid函数）,定义其代价函数为：其中y是我们期望的输出，a为神经元的实际输出【 a=σ(z), where z=wx+b 】。在训练神经网络过程中，我们通过梯度下降算法来更新w和b，因此需要计算代价函数对w和b的导数：然后更新w、b

2017-10-16 10:42:08 7077 3

常见一维条码的简要介绍

一维条码的简要介绍，包括常见的一维条码。cede128...

2011-06-23

多线程编程10例

多线程编程10例,帮你轻松入门多线程编程。

2014-01-22

MFC对话框里显示GIF动画图片

2015-01-24

ubuntu gedit color schemes

在Ubuntu系统下，习惯用gedit写代码的盆友们，是不是总觉得配色不爽，要么背景太亮，要么关键字颜色不突出。gedit默认提供的配色方案就四五种，捉襟见肘。本资源包含了上百种配色方案，总有一款适合你。

2018-05-24

等待对话框（模态）

在写程序时，经常会碰到处理大数据量的任务，例如读取尺寸巨大的图像。此时如果直接在主线程中读取，会导致主界面假死的现象。通常的解决办法是新开一个线程来负责处理比较耗时的任务。线程在处理的过程中，希望主界面弹出等待提示框，提示使用者软件正在处理数据，请等待；并且等待对话框最好是模态的，这样使用者就无法进行其他任何操作了。

2013-04-12

非常直观的讲述了CNN的工作原理

非常直观的讲述了CNN的工作原理，来自brohrer@Microsoft.com

2018-02-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人