2018年03月_DCD_Lin

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月

原创博客目录

深度学习深度学习【1】ubuntu中利用h5py保存训练好的keras 神经网络模型深度学习【2】Batch Normalization 论文翻译深度学习【3】keras：保存keras学习好的深度神经网络模型参数为二进制和txt文件深度学习【4】基于深度循环神经网络（DRNN）的单通道音乐人声分离深度学习【5】循环神经网络（RNN）反向传播算法（BPTT）理解深度学习【6...

2018-03-08 16:51:58 1256

原创深度学习【28】pytorch 遇到RuntimeError: input is not contiguous

遇到这个问题一般是使用了view或者index_select函数，解决方法：data = data.view(bsz, -1).t().contiguous()#只要在view函数后面再加个contiguous()就ok

2018-03-31 16:31:55 6626

原创深度学习【27】pytorch Variable变量方法的使用

这边记录一些Variable变量相关的一些方法。将一个numpy的张量转成Variable：Vtensor = torch.autograd.Variable(torch.LongTensor(np.int64(np.asarray(nptensor))))##torch.LongTensor确定变量类型，根据需要更改类似reshape操作：out = output...

2018-03-31 16:27:51 2113

原创 cmake调用opencv、dlib和mxnet

cmake_minimum_required(VERSION 3.6)project(imgClassification)set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++11")set(SOURCE_FILES main.cpp)find_package(OpenCV REQUIRED) #查找opencv包，需提前安装add_lib...

2018-03-31 16:01:15 926

原创 3D【10】网格优化:Laplacian Mesh Optimization

拉普拉斯网格优化与平滑是网格处理的经典算法，其一些基本概念可以作为神经网络预测3D mesh的一些约束，如平滑。我们先来看看一些基本概念。基本概念首先，我们用G=(V,E)G=(V,E)G=(V,E) 来表示一个网格。其中V=[vT1,vT2,...,vTn]T,vi=[vix,viy,viz]T∈R3V=[v1T,v2T,...,vnT]T,vi=[vix,viy,viz]T∈R...

2018-03-29 14:18:57 5318 4

原创 3D【9】人脸重建:Joint3D Face Reconstruction and Dense Alignment with Position Map Regression

该论文同时预测人脸特征点和3D mesh的顶点坐标x，y，z。人脸特征点没什么好说的，现在已经有很多成功的案例了。主要关注该论文是如何预测顶点坐标的。其实大概想想，就能够大致确定直接预测顶点坐标是有不少困难的。首先是，你不能把所有的顶点拉成一个向量，用全连接层预测；要用卷积层作为输出的话，mesh又不能直接表示成一个固定大小的张量（这正好是用cnn来预测所需要解决的问题，比如将mesh立方体化）。...

2018-03-22 17:38:02 5846 29

原创 3D【8】鸟类重建：Learning Category-Specific Mesh Reconstruction from Image Collections阅读笔记

该文章直接预测的是平均mesh的坐标偏差，相机参数和纹理uv图。里面有各种损失函数，很值得学习。这篇论文还有个有意思的点，论文用的训练数据是没有对应的3D模型的（也就是一张图片没有对应的3D模型）。训练过程有点像3DMM的重建过程，即先估计3D模型，将模型渲染到2D；然后比较渲染的图片和原始图片的差异，以更新模型的参数。要将这个过程应用在神经网络中，由于渲染是不可导的，因此需要解决渲染这一步骤...

2018-03-22 11:43:17 1702

原创 3D【7】人脸重建:Hands on Shape from Shading阅读笔记

Shape from Shading（sfs）是一个很基础也很经典的3D重建方法。其基本原理是利用灰度图片的亮度信息，加上亮度生成原理，求得每个像素在3D空间中的法向量，最终根据法向量求得深度信息。看了不少相关的文章，感觉这篇论文讲的最好懂，里面还有相应的matlab代码。所以想学sfs的同学，可以去看这篇论文。问题描述一张灰度图的亮度信息由4个因素决定： 1、光照：主要是方向，...

2018-03-17 16:27:05 5445 9

原创 3D【6】人脸重建:Multilinear Autoencoder for 3D Face Model Learning

该论文输入的是一个扫描的3d mesh，输出是一个顶点数的3d mesh。这个过程很像NICP的3d人脸配准过程，但是NICP是一个优化的过程。而该方法在学习好了网络后，可以直接使用。使用GPU的话，速度应该可以非常快。该论文还为利用CNN重建3D人脸提供了另一种思路。目前看到的用CNN进行3D人脸重建，其输出要么是3DMM的系数（没有人脸的真是深度信息），要么是将mesh立方体化（一个n1×...

2018-03-14 10:59:27 3034

原创 3D【5】人脸重建:Learning the Multilinear Structure of Visual Data阅读笔记

该论文主要内容是使用张量分解来表征一个3D人脸，如下公式：其中B(1)B(1)B_{(1)} 是通过大量数据学习出来的，而A(m)A(m)A^{(m)} 则是重构出 XXX 的系数，⊙⊙\odot 是克罗内克积。克罗内克积：一个3×1的向量和一个4×1的向量进行克罗内克积，会得到12×1的向量。具体的可参考wiki。每个A(m)A(m)A^{(m)} 可以表示不同的大分类，比如光...

2018-03-12 17:14:21 947 3

原创深度学习【26】wavenet-歌声合成

论文:A NEURAL PARAMETRIC SINGING SYNTHESIZER 完整论文：A Neural Parametric Singing Synthesizer Modeling Timbre and Expression from Natural Songs 之前研究过一段时间的wavenet语音合成。第一版wavenet的一个最大的问题是合成非常耗时，但是就有尝试过各种方案...

2018-03-08 14:16:45 5539

原创 Symbol lookup error: /usr/lib/libblas.so.3: undefined symbol: gotoblas

在安装lsfm时候遇到的一个问题,这个问题是因为conda使用的是libblas而不是openblas引起的。可以删除系统的openblas，但是这样做不好。sudo apt-get remove libopenblas-base我们直接安装一个conda的openblas就可以了：conda install -c anaconda libopenblas...

2018-03-06 08:51:08 4444

原创深度学习【25】物体检测：Tiny SSD

论文：Tiny SSD: A Tiny Single-shot Detection Deep Convolutional Neural Network for Real-time Embedded Object Detection 记录这篇论文的原因主要是想记录一下在优化yolov2时所用的网络。该论文将SSD模型优化到只有2.3M，同时在voc 2007[评测数据集上面的mAP比tiny yo

2018-03-03 15:26:31 2537 6

语音增强：理论与实践.rar

经典书籍：《语音增强：理论与实践》中的matlab代码。

2018-02-06

Neural Networks Tricks of the Trade

2017-08-25

各大高校《数据结构》考研历年真题

这是各大高校《数据结构》考研历年真题，希望对同学们有帮助

2014-08-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人