- 博客(18)
- 资源 (32)
- 收藏
- 关注
原创 image——Data Augmentation的代码
切片(crop):def crop(image, random_crop, image_size): if image.shape[1]>image_size: sz1 = int(image.shape[1]//2) sz2 = int(image_size//2) if random_crop: diff =...
2017-09-25 16:27:26 2323
原创 人脸检测——mtcnn思想,生成negative、positive、part样本。
negative样本:IOU positive样本:IOU > =0.65part样本:0.4 代码:import numpy as npimport cv2import osimport numpy.random as nprfrom utils import IoUanno_file = "./wider_annotations/anno.txt"im_d
2017-09-21 14:13:10 3176 1
原创 人脸检测——fcn
在上一篇的基础上修改即可:人脸检测——滑动窗口篇(训练和实现)!!!注意:这些是我的调试版本,最优版本不方便公开,但是自己可以查看论文,自行在此基础上修改,一定要加上回归框,要不fcn容易出现较大偏差。fcn:import tensorflow as tf import numpy as np import sys # from models import * fr
2017-09-20 07:46:31 2111
原创 简单的人脸跟踪
选用的人脸检测器:NPD Face Detector单人脸的简单跟踪MATLAB代码。close all; clear; clc;mov = VideoReader('test.mov');modelFile = 'model_frontal.mat'load(modelFile, 'npdModel')%原图中检测到的人脸位置cddBoxX=0;cddBoxY=0;cdd
2017-09-15 12:05:05 1334
原创 tf API 研读6:Running Graphs
会话管理 (Session management)操作描述class tf.Session运行TF操作的类,一个Session对象将操作节点op封装在一定的环境内运行,同时tensor对象将被计算求值tf.Session.__init__(target=”, graph=None, config=None)
2017-09-13 16:43:40 622
原创 tf API 研读5:Data IO
数据IO {Data IO (Python functions)}一个TFRecords 文件为一个字符串序列。这种格式并非随机获取,它比较适合大规模的数据流,而不太适合需要快速分区或其他非序列获取方式。数据IO {Data IO (Python functions)}操作描述class tf.python_io.TFReco
2017-09-13 15:58:36 764
原创 深度学习这些坑你都遇到过吗?
你要的答案或许都在这里:小鹏的博客目录原文地址:My Neural Network isn't working! What should I do?如果你的神经网络不工作,该怎么办?本文作者列举了搭建神经网络时可能遇到的11个常见问题,包括预处理数据、正则化、学习率、激活函数、网络权重设置等,并提供解决方法和原因解释,是深度学习实践的有用资料。如果你的神经网络不工作,该
2017-09-13 09:22:31 4777 1
原创 tf API 研读4:Inputs and Readers
tensorflow中数据的读入相关类或函数:占位符(Placeholders)tf提供一种占位符操作,在执行时需要为其提供数据data。操作描述tf.placeholder(dtype, shape=None, name=None)为一个tensor插入一个占位符eg:x = tf.placeholder(t
2017-09-12 16:25:15 1701
原创 tf API 研读3:Building Graphs
tensorflow是通过计算图的方式建立网络。比喻说明:结构:计算图建立的只是一个网络框架。编程时框架中不会出现任何的实际值,所有权重(weight)和偏移是框架中的一部分,初始时要给定初始值才能形成框架,因此需要初始化。比喻:计算图就是一个管道,编写网络就是搭建一个管道结构。在使用前,不会有任何的液体进入管道。我们可以将神将网络的权重和偏移当成管道中的阀门,可以控制液体的流动强弱和
2017-09-12 15:50:45 711
原创 tensorflow中的上采样(unpool)和反卷积(conv2d_transpose)
你要的答案或许都在这里:小鹏的博客目录MachineLP的Github(欢迎follow):https://github.com/MachineLP具体的修改可以参考这里:https://github.com/jon-sch/tensorflow/pull/3/files另外的实现可以看这里:https://github.com/yselivonchyk/Tensorflow_What...
2017-09-11 18:22:37 10819 5
原创 kinect v2.0原理介绍之十一:录制视频
不小心误删了,再加上。~~有兴趣的小伙伴,加kinect算法交流群:462964980。录制视频是结合openCV来做的。 代码如下:// 1920*1080调整为640*480#define RESOLUTIONCOLOR 640,480VideoWriter writerColor;writerColor.open("outColor.avi", CV_FOURC
2017-09-11 08:57:57 4754 3
原创 How to pass an array from C++ to an embedded python
细节问题可以查看: ubuntu下C++如何调用python程序,gdb调试C++代码 下面是C++调用Python二维数组传递的问题: #define NPY_NO_DEPRECATED_API NPY_1_7_API_VERSION#include "Python.h"#include "numpy/arrayobject.h"#include&l...
2017-09-08 10:13:52 1179
原创 Faster RCNN:RPN,anchor,sliding windows
paper链接:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal NetworksGithub源码python版本:https://github.com/MachineLP/py-faster-rcnn详细阐述:(1)首先我们需要知道anchor的本质是什么,本质是SPP(sp
2017-09-07 22:16:02 8710 4
原创 ubuntu下C++如何调用python程序,gdb调试C++代码
主要ubuntu下使用C++调用Python:#python代码:(processing_module.py)import cv2 def pre_processing(): imgfile = "./IMG_3200.png" img = cv2.imread(imgfile) h, w, _ = img.shape
2017-09-06 12:01:26 4822 3
原创 tf API 研读2:math
TF API数学计算tf...... :math(1)刚开始先给一个运行实例。 tf是基于图(Graph)的计算系统。而图的节点则是由操作(Operation)来构成的,而图的各个节点之间则是由张量(Tensor)作为边来连接在一起的。所以Tensorflow的计算过程就是一个Tensor流图。Tensorflow的图则是必须在一个Session中来计算。
2017-09-05 12:00:37 4209
原创 tf API 研读1:tf.nn,tf.layers, tf.contrib概述
你要的答案或许都在这里:小鹏的博客目录 我们在使用tensorflow时,会发现tf.nn,tf.layers, tf.contrib模块有很多功能是重复的,尤其是卷积操作,在使用的时候,我们可以根据需要现在不同的模块。但有些时候可以一起混用。 下面是对三个模块的简述: (1)tf.nn :提供神经网络相关操作的支持,包括卷积操作(conv
2017-09-04 10:46:30 15944 1
原创 人脸检测——滑动窗口篇(训练和实现)
你要的答案或许都在这里:小鹏的博客目录人脸检测:cascade cnn,mtcnn,都可以通过下面代码复现。但是下面的实现是比较low的,后面更新FCN的方法。注意mtcnn的标签加了回归框,训练时候的输出层要作修改:(回归框的作用还是很大的)# compute bbox reg label,其中x1,x2,y1,y2为真实的人脸坐标,x_left,x_right,y_to
2017-09-03 11:44:51 17501 1
原创 为什么很多做人脸的Paper会最后加入一个Local Connected Conv?
Deep face:论文。a. 人脸检测,使用6个基点b. 二维剪切,将人脸部分裁剪出来c. 67个基点,然后Delaunay三角化,在轮廓处添加三角形来避免不连续d. 将三角化后的人脸转换成3D形状e. 三角化后的人脸变为有深度的3D三角网f. 将三角网做偏转,使人脸的正面朝前。g. 最后放正的人脸h. 一个新角度的人脸(在论文中没有用到) 总
2017-09-02 09:48:28 4727
Face Recognition(face_recognition) Using Hadoop Streaming API
2017-10-08
caffe深度学习薛开宇笔记实例-基于卷积神经网络的声音识别
2016-12-27
Deep Learning textbook
2016-12-09
训练xml文件时,产生info.txt文件
2016-11-01
斯坦福大学机器学习课程个人笔记完整版
2016-04-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人