- 博客(17)
- 资源 (5)
- 收藏
- 关注
转载 caffe源码阅读1:caffe.proto解析
看caffe源码先从这里开始吧。它位于…\src\caffe\proto目录下,在这个文件夹下还有一个.pb.cc和一个.pb.h文件,这两个文件都是由caffe.proto编译而来的。 在caffe.proto中定义了很多结构化数据,包括:BlobProtoDatumFillerParameterNetParameterSolverParameterSolverStateLaye
2016-12-26 22:23:26 1484
转载 OpenCV滤波之copyMakeBorder和borderInterpolate
在OpenCV滤波算法中,有两个非常重要的基本工具函数,copyMakeBorder和borderInterpolatecopyMakeBorder函数原型void copyMakeBorder( const Mat& src, Mat& dst,int top, int bottom, int left, int right,int borderTyp
2016-12-26 11:13:04 889
转载 caffe笔记6——自定义layer
每一种层都对应一个同名cpp和hpp文件描述一下本次要实现层的功能:正向直接copy传播,反向时将梯度放缩指定倍。这个层对一些特定的网络结构有很重要的辅助作用,比如有时我们的网络存在分支,但我们不希望某一分支影响之前层的更新,那么我们就将梯度放缩0倍。(1)创建HPP头文件diff_cutoff_layer.hpp不同功能类型的层所引的头文件也不同,
2016-12-23 15:44:49 488
转载 在caffe中添加自定义的layer
在处理某些问题时,可能会需要自己去定义特定的layer来实现某些特殊功能,现将添加新的caffe layer的具体步骤进行整理,便于以后复习。(一)具体步骤如下:1. 修改{caffe_dir}/src/caffe/proto/caffe.proto 文件,在 V1LayerParameter的LayerType enum中添加新的layer的名称及ID(如:MYLAYER 38)
2016-12-23 15:20:37 950
转载 1*1的卷积核与Inception
本文介绍1*1的卷积核与googlenet里面的Inception。正式介绍之前,首先回顾卷积网络的基本概念。 1. 卷积核:可以看作对某个局部的加权求和;它是对应局部感知,它的原理是在观察某个物体时我们既不能观察每个像素也不能一次观察整体,而是先从局部开始认识,这就对应了卷积。卷积核的大小一般有1x1,3x3和5x5的尺寸。卷积核的个数就对应输出的通道数,这里需要说明的是对于输入的每个通道,
2016-12-22 23:20:29 1068
转载 caffe学习笔记5——solver文件解析
solver算是caffe的核心的核心,它协调着整个模型的运作。caffe程序运行必带的一个参数就是solver配置文件。在Deep Learning中,往往loss function是非凸的,没有解析解,我们需要通过优化方法来求解。solver的主要作用就是交替调用前向(forward)算法和后向(backward)算法来更新参数,从而最小化loss,实际上就是一种迭代的优化算法。到
2016-12-19 22:39:40 461
转载 caffe笔记4——c++接口
本文主要解释官方提高的C++程序,通过这个程序来认识caffe的C++调用方式。#include <caffe/caffe.hpp>#ifdef USE_OPENCV#include <opencv2/core/core.hpp>#include <opencv2/highgui/highgui.hpp>#include <opencv2/imgproc/imgproc.hpp>#endi
2016-12-17 20:36:49 1142
原创 Two-Stream Convolutional Networks for Action Recognition in Videos
下载地址:http://www.datascienceassn.org/sites/default/files/Two-Stream%20Convolutional%20Networks%20for%20Action%20Recognition%20in%20Videos.pdfWhat’s problem?这篇论文主要是介绍了一种新的视频卷积的方法,并且将其应用于UCF-101和HMDB-51数据
2016-12-16 15:07:26 2552
原创 caffe笔记3——用python实现mnist
官网教程:http://nbviewer.jupyter.org/github/BVLC/caffe/blob/master/examples/01-learning-lenet.ipynb1. 改变工作目录:import os caffe_root = '/home/adam/caffe-master/' os.chdir(caffe_root) 2 导入相应的包import sys
2016-12-16 14:00:00 1674
原创 caffe笔记2——mnist例子
官网地址:http://caffe.berkeleyvision.org/gathered/examples/mnist.html一.准备数据首先,我们需要从网上下载数据,在caffe根目录下运行一下命令./data/mnist/get_mnist.sh ./examples/mnist/create_mnist.sh 运行完后,会出现如下两个文件:mnist_train_lmdb, and m
2016-12-15 21:08:00 520
原创 caffe笔记1——文件结构
caffe文件夹下的文件目录结构如下图: 最重要的三个文件夹就是include, tools, src。读源码也就是主要读这三个文件夹,src文件的结构如下: 在caffe教程中,介绍了caffe的三级结构(http://caffe.berkeleyvision.org/tutorial/net_layer_blob.html ):Blobs, Layers,Nets.如下图所示:(更多内容
2016-12-15 20:34:14 379
原创 3D Convolutional Neural Networks for Human Action Recognition
转载自 http://blog.csdn.net/zouxy09一、概述在现实的环境中,不同的场景存在杂乱背景、阻挡和视角变化等等情况,对于人来说,很容易就可以辨识出来,但对于计算机,就不是一件简单的事了。而以前的Human Action Recognition方法都是基于一些对应用场景苛刻的假设上的,例如目标小的尺度变化和小的视觉改变等。但这在现实世界中是很难满足的。目前,在这方面,大部分
2016-12-14 16:24:42 4788 4
转载 光流法简单介绍
光流的概念是Gibson在1950年首先提出来的。它是空间运动物体在观察成像平面上的像素运动的瞬时速度,是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。一般而言,光流是由于场景中前景目标本身的移动、相机的运动,或者两者的共同运动所产生的。其计算方法可以分为三类: (1)基于区域或者基于特征的匹配方法;
2016-12-13 23:12:50 538
原创 Leetcode 27 Remove Element(移除数组中的指定元素)
Given an array and a value, remove all instances of that value in place and return the new length.Do not allocate extra space for another array, you must do this in place with constant memory.The order
2016-12-05 20:02:36 561
原创 Leetcode 80. Remove Duplicates from Sorted Array II(从已排序数组中移除重复元素)
跟26一样 给定一个已排序的数组,删除重复的元素,这样每个元素最多只出现两次,并且返回新的数组长度。不允许为另一个数组使用额外的空间,你必须就地以常量空间执行这个操作。例如, 给定[1,1,1,2,2,3]你的函数应该返回length = 5, 其数组元素分别是1,1,2,2,3。它不关心你离开后的新长度。class Solution {public: int removeDuplic
2016-12-05 19:25:03 338
原创 LeetCode 26 Remove Duplicates from Sorted Array(从已排序数组中移除重复元素)
给定一个已排序的数组,删除重复的元素,这样每个元素只出现一次,并且返回新的数组长度。不允许为另一个数组使用额外的空间,你必须就地以常量空间执行这个操作。例如, 给定输入数组为 [1,1,2]你的函数应该返回length = 2, 其前两个元素分别是1和2。它不关心你离开后的新长度。class Solution {public: int removeDuplicates(vector<in
2016-12-04 19:41:06 295
原创 SLAM笔记六——Unscented Kalman Filter
卡尔曼滤波都需要线性模型,EKF用的是泰勒公式进行局部线性的方法,而UKF提供了另一种线性化的方法。Unscented Transform步骤: 首先选择一组点,称为sigma点 然后通过非线性函数映射这些点: 最后通过对映射点计算高斯分布形式,和每个sigma点的权重: sigma点的选择选择的sigma点满足以下式子: 第一个点选择均值,其余点根据另外两个式子选择:
2016-12-01 10:51:06 9207 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人