shuzfan-CSDN博客

原创基于TensorFlow的SSD车辆检测-3

百度云链接总是挂掉，大家实在有需要发我邮箱吧shuzfan@163.com此系列博客是用来学习Tensorflow和Python的，由于是新手上车，如有错误之处希望大家不吝指出。整个项目可以从百度云下载：链接：https://pan.baidu.com/s/1f2JPJpE7m5M2kSifMP0-Lw 密码：9p8v谷歌云盘：https://drive.google.com/...

2018-04-16 21:07:30 7158 3

原创基于TensorFlow的SSD车辆检测-2

此系列博客是用来学习Tensorflow和Python的，由于是新手上车，如有错误之处希望大家不吝指出。整个项目可以从百度云下载：链接：https://pan.baidu.com/s/1f2JPJpE7m5M2kSifMP0-Lw 密码：9p8v二. SSD网络构建在网络模型构建环节，主要包含下面三块内容：构建网络的基础部分：VGG_base构建网络的分支部分：SSD的6个预测...

2018-04-02 16:24:13 8198 13

原创 latex对修改内容进行高亮

论文修改时，编辑要求对修改内容进行高亮显示。比较简单的处理方法是使用下面的方式：\usepackage{soul}\hl{This will be highlight.}但是遇到\cite、\ref等命令时该方式就容易出错。解决方法很简单，对这些命令进行注册：\usepackage{soul}\soulregister\cite7 % 针对\cite命令\soulreg...

2018-03-07 22:49:45 55196 3

原创 tensorflow模型保存与加载

tensorflow版本为1.4.1tensorflow提供了Saver类用于模型的保存与导入。该类定义在tensorflow/python/training/saver.py.中。Saver类的默认初始化函数如下：__init__( var_list=None, reshape=False, sharded=False, max_to_keep=5

2018-01-29 17:04:13 10794 3

原创 tensorflow创建变量以及根据名称查找变量

环境：Ubuntu14.04，tensorflow=1.4(bazel源码安装)，Anaconda python=3.6声明变量主要有两种方法：tf.Variable和 tf.get_variable，二者的最大区别是：(1) tf.Variable是一个类，自带很多属性函数；而 tf.get_variable是一个函数;(2) tf.Variable只能生成独一无二的变量，即如果给出

2018-01-28 15:41:01 16178 3

原创 tensorboard使用问题解决记录

环境：Ubuntu14.04，tensorflow=1.4(bazel源码安装)，Anaconda python=3.61. 找不到tensorboard执行下面命令时tensorboard --logdir=...提示：tensorboard: command not found解决方法有两个：(1) 编译好的tensorboard工具其路径通常为 **

2018-01-17 16:07:43 11686

原创 tensorflow中Batch Normalization的实现

tensorflow版本1.4tensorflow目前还没实现完全封装好的Batch Normalization的实现，这里主要试着实现一下。关于理论可参见《解读Batch Normalization》对于TensorFlow下的BN的实现，首先我们列举一下需要注意的事项：（1）需要自动适应卷积层(batch_size*height*width*channel)和全连接层(ba

2018-01-13 23:47:41 12713 2

原创 tensorflow获取变量维度信息

tensorflow版本1.4获取变量维度是一个使用频繁的操作，在tensorflow中获取变量维度主要用到的操作有以下三种：Tensor.shapeTensor.get_shape()tf.shape(input,name=None,out_type=tf.int32)对上面三种操作做一下简单分析：（这三种操作先记作A、B、C）A 和 B 基本一样，只不过前者是Tens

2018-01-13 14:08:09 26116

原创基于TensorFlow的SSD车辆检测-1

此系列博客是用来学习Tensorflow和Python的，由于是新手上车，如有错误之处希望大家不吝指出。整个项目可以从百度云下载：链接：https://pan.baidu.com/s/1f2JPJpE7m5M2kSifMP0-Lw 密码：9p8v一. 训练数据准备在训练数据准备环节，主要包含下面三块内容：怎样解析用于车辆检测训练的KITTI数据集怎样进行数据扩张来增大训练数据的...

2018-01-11 15:15:09 15372 30

原创修改vim配色方案

通常VIM配色方案文件存放在“/usr/share/vim/vim74/colors” ，具体位置可能略有差异。比如我的该目录下的内容为：（其中“.vim”就是配色方案）blue.vim default.vim desert.vim evening.vim koehler.vim morning.vim pablo.vim README.txt shin

2018-01-08 19:37:26 25473 2

原创 Win10中Linux子系统安装tesorflow

记录一下在Win10自带的Linux子系统中安装Anaconda【参考 linux下安装Anaconda】，以及安装opencv3并配置tensorflow的过程。（1）安装Anaconda到清华大学Anaconda镜像站下载最新版本的Ananconda-Anaconda3-5.0.1-Linux-x86_64.sh其中3-5.0.1表示python版本是3.6的。（2）安

2018-01-07 17:36:36 4838

原创 PUDB调试python程序

PUDB是全屏的基于控制台的可视化调试器，主页为https://pypi.python.org/pypi/pudb其特点主要有： - 源码语法高亮，栈、断点、变量可见并且一直动态更新。变量展示还有很多可以定制化的功能 - 基于键盘，简单高效。支持光标键和Vi快捷键导航，还支持PDB的某些命令 - 支持搜索源代码，可以使用“m”来调用显示加载模块的模块浏览器 - 可以通过定位一行

2018-01-03 18:31:09 8201

1. 安装vnc serverapt-get install vnc4server安装完成后，继续执行“vncserver”，按照提示设置VNC登陆时的密码。上述操作执行完成后会在用户home目录下，产生 “.vnc/xstartup”文件。2. 安装桌面及文件管理器apt-get install gnome-panel gnome-settings-daemon metacity nautilus

2017-12-30 13:50:44 12366 1

原创 tensorflow实现简单卷积网络进行mnist分类

所有代码数据可在百度云下载：链接: https://pan.baidu.com/s/1c31hKLM 密码: 4tpm所有涉及tensorflow API用法的，均可查看https://tensorflow.google.cn/api_docs/下面的代码实现了一个简单的卷积神经网络，来处理MNIST手写数字识别问题。import input_dataimport tensorf

2017-12-04 21:30:36 4246

原创 Sublime Text3 解决中文输入法不跟随问题

win10 下Sublime text3，如果使用自带输入法则候选框始终在左上角，如果使用搜过输入法则候选框始终在偏右下位置。解决方法：到https://github.com/zcodes/IMESupport下载压缩包，然后解压到Sublime text3的package路径。 package路径可以通过菜单栏preferences->Browse Packages找到。解压完成后，重启。目前的

2017-12-04 15:26:31 8864

原创深度学习入门基础讲义

工作确定以后，闲暇时间做了如下一个PPT讲义，用于向实验室新生学弟学妹介绍深度学习。他们大部分在本科期间学习通信相关专业课程，基本没有接触过图像处理和机器学习。对于一个研究生而言，自学应当是一个最基本也是最重要的能力。自学不仅是独立学习，更是主动学习。因此，该讲义的目的主要是为新生打开一个大门，使其对深度学习有一个模糊的认识，并顺便了解一些常见的概念。而真正走进深度学习，还需要各自的努力。该讲义尽

2017-11-20 20:32:04 10144 6

原创 tensorflow实现单层感知机对MNIST分类

所有代码数据可在百度云下载：链接: https://pan.baidu.com/s/1c31hKLM 密码: 4tpm所有涉及tensorflow API用法的，均可查看https://tensorflow.google.cn/api_docs/下面的代码实现了一个单层感知机(Single Layer Perceptron) y=softmax(wx+b)，来处理MNIST手写数字识别

2017-11-14 22:05:30 4236 1

原创如何在tensorflow中屏蔽Debug信息

在python中执行import tensorflow as tftf.__version__获取到我的tf版本为1.4.0我在Tensorflow中文社区学习的时候，在执行下面的基础代码时(我已经修改为在python3.6下可以运行)：import tensorflow as tfimport numpy as np# 使用 NumPy 生成假数据(phony data), 总共 100 个点

2017-11-13 15:39:41 7014 1

原创 linux下tensorflow安装

如无特殊说明，所有操作都在Linux系统上完成，并假定只有普通用户权限。(仅有CUDA和cudnn安装需要用到管理员权限)一、安装TensorFlow1. 使用pip从二进制文件安装注意：最新版本的二进制文件链接地址，可以通过TensorFlow官网获取 https://www.tensorflow.org/install/install_linux请安装最新版的pip，或者使用pip in

2017-11-13 01:23:56 56222 2

原创 linux下安装Anaconda

从https://repo.continuum.io/archive/index.html上下载对应版本的Anaconda。比如我选择安装 Anaconda3-5.0.1-Linux-x86_64.sh，(对应python3.6，x64系统)可以采用下列命令。wget https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86

2017-11-12 11:15:13 19842 1

原创测试优化求解算法的一些简单绘图函数

最近做PPT，需要绘制一张有多个极小点的3D图像。偶然发现了一个网站，里面有各种这样的绘图函数。以作记录。http://www.sfu.ca/~ssurjano/index.html比如高斯分布：(图我是倒着画的)比如GrieWank 函数：比如ACKLEY函数：

2017-11-01 18:49:46 1398 1

原创 linux下常见版本查询操作

系统版本查询1. 使用uname命令打印所有版本信息。(可通过uname –help查看使用方法)uname －a (我的)输出：Linux cvlab-MS-7A71 4.4.0-93-generic #116~14.04.1-Ubuntu SMP Mon Aug 14 16:07:05 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux4.4.0-93-generi

2017-10-29 11:22:31 7724

原创跨媒体分析与推理

跨媒体分析与推理1. 什么是跨媒体分析与推理？媒体在计算机领域有两种含义：一是指媒介，即存储信息的实体，如磁盘、光盘、磁带、半导体存储器等；二是指传递信息的载体，如数字、文字、声音、图形、图像等。以往的媒体信息处理模型往往只针对某种单一形式的媒体数据进行推理分析，比如图像识别、语音识别、文本识别等。而越来越多的任务需要像人一样能够协同综合处理多种形式(文本、音频、视频、图像等)的信息，这就是跨媒体

2017-10-27 14:07:04 14340

转载 Vim 操作

介绍一些VIM常用操作。

2017-10-22 20:19:04 627

原创 COCO Loss

2017NIPS：《Rethinking Feature Discrimination and Polymerization for Large-scale Recognition》Github项目主页： https://github.com/sciencefans/coco_loss文章方法简称 congenerous cosine loss, “COCO Loss”，其目的同样是：拉近同类

2017-10-22 15:56:01 4209 1

原创 Linux用户与用户组管理

下面介绍中的截图，来自于Win10 Linux子系统。更多linux命令可参考http://man.linuxde.net/一、多用户多任务Linux 是一个多用户、多任务的操作系统。比如通过远程访问，多个用户可以同时登陆一个系统并执行各自的多个任务。用户在系统中是分角色的，并通过UID和GID进行区分。UID就是用户ID，GID就是群组的ID号。在Linux 系统中，由于角色不同，权限和所完成

2017-10-19 16:41:07 1920

原创 Dual Path Networks

《Dual Path Networks》一篇讲如何设计网络结构的文章，大体上整合了ResNet和 DenseNet的优点： - ResNet：侧重于特征的再利用(因为整合特征采用的是加和操作) - DenseNet: 侧重于新特征的发掘(因为整合特征采用的是拼接操作)我认为文章最大的贡献是为ResNet和DenseNet找到了一个形式统一的数学表达。Github项目主页： https://

2017-10-18 16:31:59 3353

原创 Win10 如何以管理员身份设置开机自启程序(2)

自己水平太菜，对Windows的权限问题一直不是特别了解。之前在《Win10 如何以管理员身份设置开机自启程序(1)》一文中介绍了：通过Windows“任务计划程序”来实现以管理员身份开机自启。但是，但是，遇到一台奇怪的Win10系统，上边的策略行不通。一旦设置管理员运行，就无法成功开机自启。后来瞎蒙出一种方法：(1) 对“A.exe”创建快捷方式“A.lnk”(2) 右键“A.lnk”-> 高

2017-09-30 13:20:24 8010 4

原创 Win10 如何以管理员身份设置开机自启程序(1)

最近一个项目在win10上部署时遇到问题，即如何设置以管理员身份开机自启。现把解决方法整理如下：首先，为了进行验证，我编了一个简单的程序test.exe(在C盘系统文件中创建一个文件)：#include <iostream>#include <fstream>using namespace std;int main(){ ofstream temp("C:/Program Files

2017-09-27 23:33:44 43203 17

原创 DenseNet

2017CVPR Best Paper：《Densely Connected Convolutional Networks》Github项目主页： https://github.com/liuzhuang13/DenseNet知乎上的一些讨论：如何评价Densely Connected Convolutional Networks？DenseNet属于对ResNet扩展的一系列工作中比较有代表性

2017-09-22 19:44:22 4343 1

原创 Scale-Aware Face Detection

2017CVPR 文章链接：《Scale-Aware Face Detection》对于人脸检测，通常我们需要采用各种手段小心的处理多尺度的问题。事实上，对于很多待检测图像，其只在某个尺度上才有人脸存在。如果我们可以“提前预知”哪些尺度上存在人脸，就可以针对性的进行检测从而减少计算量。1. 方法介绍整个检测分为两个阶段：stage1，输入缩小的图片进入Scale Proposal Network

2017-09-14 20:11:11 2811 1

原创不规则卷积神经网络

来自中科院自动化所的“不规则卷积神经网络”。文章链接：《Irregular Convolutional Neural Networks》从直观上来看，一个不规则的卷积核(其shape可以自动学习)似乎更适应输入的pattern。但考虑更多方面，比如学习效率、操作复杂度这些因素。个人认为，不规则卷积目前不是一个很值得称赞的工作。1. 方法介绍上图中，图(a)表示一个不规则卷积；图(b)表示，尽

2017-09-13 12:44:40 4345 2

原创 S3FD: Single Shot Scale-invariant Face Detector

一篇同样着重处理人脸尺度问题的检测文章。方法可以看作是对SSD的改进与完善，速度较慢(36FPS with Titan X & VGA)。文章链接：《S3FD: Single Shot Scale-invariant Face Detector》code will be aviable at https://github.com/sfzhang15/SFD1. 方法介绍如上图，整体方法结构和SS

2017-09-11 14:03:37 10347 3

原创 FaceBoxes —— CPU上实时的人脸检测

一篇速度还可以的多尺度人脸检测文章。方法和SSD大同小异。文章链接：《FaceBoxes: A CPU Real-time Face Detector with High Accuracy》1. 方法介绍如上图，输入单张图片，在三个网络分支检测人脸。2. 要点介绍（1）Rapidly Digested Convolutional Layers(RDCL)在网络前期，使用RDCL快速的缩小feat

2017-09-07 15:11:43 17832 2

原创 ScaleFace —— 尺度友好人脸检测

一篇关于如何处理多尺度人脸检测的文章。从核心方法上来说和SSD没有本质的区别，只不过在实现细节上做了一些更为细致的工作。文章链接：《Face Detection through Scale-Friendly Deep Convolutional Networks》1. 方法介绍如上图，采用ResNet网络，输入单张图片。在网络不同阶段引出分支，然后后接RPN和Fast R-CNN。共有3个分

2017-09-07 11:57:03 3720

原创 ShiftCNN —— 基于量化的低精度网络表达

一个利用低精度和量化技术实现的神经网络压缩与解决方案。个人认为，这是低精度量化方面少有的具有高度工程可行性的一个方案(虽然文中没有给出详细的模型大小速度方面的指标)。文章链接：《ShiftCNN: Generalized Low-Precision Architecture for Inference of Convolutional Neural Networks》模型转换示例代码： http

2017-09-05 21:28:22 6183

原创 DAN —— 人脸关键点

人脸关键点检测的论文。速度略差，但想法不错。视频中人脸关键点检测往往存在抖动，而常见的深度学习方法又不适合做连续跟踪。本文提供了一个实现跟踪的思路。文章链接： CVPR Workshop2017《Deep Alignment Network: A convolutional neural network for robust face alignment》源码(Theano实现)： https:

2017-09-04 16:47:48 12271 1

原创 Face R-CNN

又是一个用Faster R-CNN框架做人脸检测的，公开测试集指标又高了。T_T文章链接《Face R-CNN》http://cn.arxiv.org/abs/1706.01061大体的框架保持不变：主要改进点：(1) Center loss对于最后的二分类，在softmax的基础上增加了center loss。为了使得center loss均衡，一个mini batch中正负样本比例限制为1：1

2017-09-04 12:59:07 3897 2

原创 CReLU激活函数

一种改进ReLU激活函数的文章，来自ICML2016.文章链接：《Understanding and Improving Convolutional Neural Networks via Concatenated Rectified Linear Units》caffe实现： https://github.com/farmingyard/ShuffleNet1. 背景介绍整个文章的出发点来自于下

2017-09-03 00:04:56 16848 5

原创友元函数与友元类

面向对象编程的一个重要思想就是实现数据隐藏(类的封装特性)，即：非成员函数不能访问private 或者 protected 变量。有些时候我们需要不经成员函数而访问private 或者 protected数据，那就需要用到友元函数或者友元类。1. 友元函数使用 friend 关键字在类内任意位置声明函数为友元函数。而且，当要访问非static成员时，需要对象作为参数。如下：#include

2017-08-31 12:11:49 1324

MKL最全说明文档

MKL——最全说明文档

空空如也