2017年09月_guoyunfei20

12月 11月 10月 09月 08月 07月 06月 01月

转载基于 HED网络TensorFlow 和 OpenCV 实现图片边缘检测

传统的边缘检测：OpenCV 里面的两个函数，cv2.Canny() 和 cv2.findContours()：看上去很容易就能实现出来，但是真实情况是：复杂背景时根本不好使！canny算法的检测效果，依赖于几个阈值参数，这些阈值参数的选择，通常都是人为设置的经验值。在改进的过程中，引入额外的步骤后，通常又会引入一些新的阈值参数，同样，也是依赖于调试结果设置的经验值

2017-09-30 18:25:35 2931

原创 CNN发展的主要tag

=======================================================AlexNet：一切都从这里开始（尽管有些人会说是Yann LeCun 1998年发表的那篇论文才真正开启了一个时代）。这篇论文，题目叫做“ImageNet Classification with Deep Convolutional Networks”，迄今被引用6184次，被业

2017-09-30 17:28:57 537 1

转载 RCNN

RCNN (Rich feature hierarchies for accurate object detection and semantic segmentation) 是将CNN方法引入目标检测领域，大大提高了目标检测效果，可以说改变了目标检测领域的主要研究思路。论文主要特点（相对于传统方法的改进）：>> 速度经典的目标检测算法使用滑动窗法依次判断所有可能的区域。本文则(

2017-09-30 14:21:59 565

转载 object detection方法汇总

传统方法：传统的目标检测使用滑动窗口的框架，把一张图分解成几百万个不同位置不同尺度的子窗口，针对每个子窗口，使用分类器判断是否包含目标物体。传统方法针对不同类别的物体，一般会设计不同的特征和分类算法。比如：>> 人脸检测（face detetion）的经典算法是Haar特征 + Adaboost分类器>> 行人检测的经典算法是Hog（histogram of gradients）+ S

2017-09-30 13:47:17 1039

翻译 Relu及其延伸

近年来，在深度学习中，ReLU 变的越来越受欢迎。它的数学表达式很简单：f(x)=max(0,x)。显然，输入信号0 的情况下，输出等于输入。二维情况下，使用ReLU之后的效果如下：ReLU 的优点：收敛速度会比 sigmoid/tanh 快很多相比于 sigmoid/tanh，ReLU 只需要一个阈值就可以得到激活值，而不用去算一大堆复杂的运算。ReLU 的缺

2017-09-30 10:21:10 4504 1

原创 gedit plugins

Ubuntu下编程，老手会用“终端+vim”，因为这个组合可以摆脱鼠标，完成鼠标可以完成的几乎所有的操作。但一些用惯鼠标的人来说，还是很不能适应的。下边介绍一下如何打造“终端+gedit”编译环境。1. gedit自带的plugins在安装ubuntu系统时，会自带gedit软件。它本身有一些插件（安装gedit时，默认就有），大致如下：>> Check update: Check f

2017-09-29 18:47:53 1391

原创数据增强（data Augmentation）

在深度学习中，当数据量不够大时候，经常通过人工增加训练集的大小。不同的任务背景下, 我们可以通过图像的几何变换, 使用以下一种或多种组合数据增强变换来增加输入数据的量. 这里具体的方法都来自数字图像处理的内容：1. 旋转|反射变换(Rotation/reflection)：随机旋转图像一定角度; 改变图像内容的朝向;2. 翻转变换(flip): 沿着水平或者垂直方向翻转图像;3. 缩放

2017-09-28 14:12:37 6208

原创 AlexNet

AlexNet是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的。也是在那年之后，更多的更深的神经网路被提出，比如优秀的vgg,GoogleLeNet。其官方提供的数据模型，准确率达到57.1%,top 1-5 达到80.2%. 这项对于传统的机器学习分类算法而言，已经相当的出色。上图所示是caffe中alexnet的网络结构，上图采用

2017-09-28 13:10:38 38843 10

原创 opencv3.3 svm的使用

在OpenCV 3.3中取消了CvSVM类的定义，结构变成了这样的了：具体可参考文档：http://docs.opencv.org/3.3.0/d1/d2d/classcv_1_1ml_1_1SVM.html#a77d9a35898cae44ac9071c4b35bc96a8下边将OpenCV老版本的例子用OpenCV3.3的重新写了一下，亲测通过：#include #inc

2017-09-26 18:43:40 3237 1

原创 Adaboost人脸检测介绍（都是大白话）

Haar特征>> 最早的Haar特征由Papageorgiou C.等提出（《A general framework for object detection》）>> 之后Paul Viola和Michal Jones提出利用积分图像法快速计算Haar特征的方法（《Rapid object detection using a boosted cascade of simple featur

2017-09-22 15:14:20 4515 2

翻译 HOG特征

Histogram of Oriented Gridients，缩写为HOG，是目前计算机视觉、模式识别领域很常用的一种描述图像局部纹理的特征。原理就是先计算图片某一区域中不同方向上梯度的值，然后进行累积，得到直方图，这个直方图呢，就可以代表这块区域了，也就是作为特征，可以输入到分类器里面了。接下来是步骤：1. 图像分块（patch）简单来说就是将图像分割成若干小块2. 计算每

2017-09-22 11:49:06 269

转载图像识别常见的数据集

ImageNet（官网：http://www.image-net.org/，需要注册才可以下载）目前世界上图像识别最大的数据库。美国斯坦福的计算机科学家李飞飞模拟人类的识别系统建立的。能够从图片识别物体。目前已经包含14197122张图像，是已知的最大的图像数据库。每年的ImageNet大赛更是魂萦梦牵着国内外各个名校和大型IT公司以及网络巨头的心。CIFAR（Canada Institu

2017-09-22 11:21:17 10062

原创 CNN中卷积的意义

在传统的神经网络中，比如多层感知机（MLP），其输入通常是一个特征向量。需要人工设计特征，然后将用这些特征计算的值组成特征向量。在过去几十年的经验来看，人工找的特征并不总是好用。有时多了，有时少了，有时选的特征根本就不起作用（真正起作用的特征在浩瀚的未知里）。这就是为啥过去几十年神经网络一直被SVM等完虐的原因。如果有人说，任何特征都是从图像中提取的。那如果把整幅图像作为特征来训练神经网络不就

2017-09-21 18:08:57 6741 1

原创似然函数（likelihood）、最大似然函数、最小二乘解

在英语语境里，likelihood 和 probability 的日常使用是可以互换的，都表示对机会 (chance) 的同义替代。但在数学中，probability 这一指代是有严格的定义的，即符合柯尔莫果洛夫公理 (Kolmogorov axioms) 的一种数学对象（换句话说，不是所有的可以用0到1之间的数所表示的对象都能称为概率）。而 likelihood (function) 这一概念是

2017-09-21 16:46:07 33254

原创 protobuf

一. 什么是Protobuf官方文档给出的是：a language-neutral, platform-neutral, extensible way of serializing structured data for use in communications protocols, data storage, and more.二. Protobuf的优点- 性能好，效率高

2017-09-20 19:08:33 317

原创 Eigen

Eigen 是一个线性算术的C++模板库，包括：vectors, matrices, 开源以及相关算法。功能强大、快速、优雅以及支持多平台，可以使用该库来方便处理一些矩阵的操作，达到类似matlab那样的快捷。// eigen官网http://eigen.tuxfamily.org/index.php?title=Main_Page使用：Eigen不依赖任何库。所以如果仅仅使用，直接包含

2017-09-20 18:44:38 420

原创 bazel

----什么是bazel----Bazel可以快速地构建可靠的代码，谷歌的大多数软件都是由它来构建，因此，在谷歌的开发环境里，它主要负责处理代码构建相关问题：大规模数据构建问题，共享代码库问题，从源代码构建的软件的相关问题。

2017-09-20 17:58:30 8715

翻译前向传播和反向传播（举例说明）

假设神经网络结构如下图所示：有2个输入单元；隐含层为2个神经元；输出层也是2个神经元，隐含层和输出层各有1个偏置。为了直观，这里初始化权重和偏置量，得到如下效果：----前向传播----隐含层神经元h1的输入：代入数据可得：假设激励函数用logistic函数，计算得隐含层神经元h1的输出：同样的方法，可以得到隐含层神经元h

2017-09-19 16:25:06 30859 6

翻译卷积（通俗解释）

----卷积定义----连续形式：离散形式：----离散卷积的举例----假设有俩个骰子，同时把这俩骰子抛出去，求落地后俩骰子点数加起来为4的概率是多少?我们把骰子各个点数出现的概率表示出来:那么，两枚骰子点数加起来为4的情况有：因此，两枚骰子点数加起来为4的概率为：用卷积形式来表达就是：----图像处

2017-09-19 15:32:39 799

翻译自适应提升算法（AdaBoost）介绍（二）

提升方法（boosting）介绍：提升方法基于这样一个思想：对于一个复杂任务来说，将多个专家的判断进行适当综合所得出的判断，要比其中任何一个专家单独的判断要好。实际上，就是“三个臭皮匠顶个诸葛亮”的道理。提升方法的问题在于，在学习中，如果已经发现了弱学习算法，能否将它提升为强学习算法。因为在应用中，发现弱学习算法要比强学习算法容易得多。关于提升的策略，最具代表性是AdaBoost算法。对于分类

2017-09-18 18:13:25 2087

翻译集成方法，或者叫做组合方法（Ensemble methods）介绍（一）

集成方法的思想就是将若干个分类器组合起来（或者把一种算法的不同参数组合到一起），以改进各单个分类器的效果。集成方法大致分两类：1. Averaging methods（平均方法）：就是利用训练数据的全集或者一部分数据训练出几个算法或者一个算法的几个参数，最终的算法是所有这些算法的算术平均。比如Bagging Methods（装袋算法），Forest of Randomized Trees（

2017-09-18 17:51:52 4781

原创贝叶斯相关（整理）

----贝叶斯理论----在古代，人们对一件事情发生或不发生的概率，只有固定的0和1，即要么发生，要么不发生，从来不会去考虑某件事情发生的概率有多大，不发生的概率又是多大。比如如果问那时的人们一个问题：“有一个袋子，里面装着若干个白球和黑球，请问从袋子中取得白球的概率是多少？”他们会想都不用想，会立马告诉你，取出白球的概率就是1/2，要么取到白球，要么取不到白球，即θ只能有一个值，不是1/2，

2017-09-18 16:22:14 1239

原创 Dlib的编译和使用（二）

1. 从git上下载最新代码：git clone https://github.com/davisking/dlib.git2. 进到exeamples文件夹内，然后开始编译所有的examples（这只是教你怎么快速使用dlib库中的examples）mkdir build; cd build; cmake .. // 注意俩点cmake --build .3. 编译自己的工程

2017-09-18 11:37:54 2729

原创 Dlib库介绍（一）

Dlib是一个包含机器学习算法的C++开源工具包。Dlib可以帮助您创建很多复杂的机器学习方面的软件来帮助解决实际问题。目前Dlib已经被广泛的用在行业和学术领域，包括机器人，嵌入式设备，移动电话和大型高性能计算环境。Dlib是开源的、免费的；官网和git地址：# 官网http://dlib.net/# githubhttps://github.com/davisking/dlib

2017-09-18 10:33:05 39192 3

原创 ubuntu系统 - python中用cv2.VieoCapture()读取视频失败，咋整？如果用尽方法仍然无法解决，不妨换个别的库吧

近日在Python环境中用cv2.VideoCapture()读取视频时，cv2.VideoCapture.open()始终返回False。去百度一查，遇到该情况的一大堆。然后查看opencv的官方文档，发现如下内容：以下内容的出处：https://pypi.python.org/pypi/opencv-pythonQ: Why I can’t open video files on GNU

2017-09-14 11:09:58 7816 5

ubuntu gedit color schemes

在Ubuntu系统下，习惯用gedit写代码的盆友们，是不是总觉得配色不爽，要么背景太亮，要么关键字颜色不突出。gedit默认提供的配色方案就四五种，捉襟见肘。本资源包含了上百种配色方案，总有一款适合你。

2018-05-24

非常直观的讲述了CNN的工作原理

非常直观的讲述了CNN的工作原理，来自brohrer@Microsoft.com

2018-02-27

MFC对话框里显示GIF动画图片

2015-01-24

等待对话框（模态）

在写程序时，经常会碰到处理大数据量的任务，例如读取尺寸巨大的图像。此时如果直接在主线程中读取，会导致主界面假死的现象。通常的解决办法是新开一个线程来负责处理比较耗时的任务。线程在处理的过程中，希望主界面弹出等待提示框，提示使用者软件正在处理数据，请等待；并且等待对话框最好是模态的，这样使用者就无法进行其他任何操作了。

2013-04-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人