- 博客(13)
- 资源 (4)
- 收藏
- 关注
原创 博客目录
深度学习深度学习【1】ubuntu中利用h5py保存训练好的keras 神经网络模型 深度学习【2】Batch Normalization 论文翻译 深度学习【3】keras:保存keras学习好的深度神经网络模型参数为二进制和txt文件 深度学习【4】基于深度循环神经网络(DRNN)的单通道音乐人声分离 深度学习【5】循环神经网络(RNN)反向传播算法(BPTT)理解 深度学习【6...
2018-03-08 16:51:58 1256
原创 深度学习【28】pytorch 遇到RuntimeError: input is not contiguous
遇到这个问题一般是使用了view或者index_select函数,解决方法:data = data.view(bsz, -1).t().contiguous()#只要在view函数后面再加个contiguous()就ok
2018-03-31 16:31:55 6626
原创 深度学习【27】pytorch Variable变量方法的使用
这边记录一些Variable变量相关的一些方法。将一个numpy的张量转成Variable:Vtensor = torch.autograd.Variable(torch.LongTensor(np.int64(np.asarray(nptensor))))##torch.LongTensor确定变量类型,根据需要更改类似reshape操作:out = output...
2018-03-31 16:27:51 2113
原创 cmake调用opencv、dlib和mxnet
cmake_minimum_required(VERSION 3.6)project(imgClassification)set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++11")set(SOURCE_FILES main.cpp)find_package(OpenCV REQUIRED) #查找opencv包,需提前安装add_lib...
2018-03-31 16:01:15 926
原创 3D【10】网格优化:Laplacian Mesh Optimization
拉普拉斯网格优化与平滑是网格处理的经典算法,其一些基本概念可以作为神经网络预测3D mesh的一些约束,如平滑。我们先来看看一些基本概念。基本概念首先,我们用G=(V,E)G=(V,E)G=(V,E) 来表示一个网格。 其中V=[vT1,vT2,...,vTn]T,vi=[vix,viy,viz]T∈R3V=[v1T,v2T,...,vnT]T,vi=[vix,viy,viz]T∈R...
2018-03-29 14:18:57 5318 4
原创 3D【9】人脸重建:Joint3D Face Reconstruction and Dense Alignment with Position Map Regression
该论文同时预测人脸特征点和3D mesh的顶点坐标x,y,z。人脸特征点没什么好说的,现在已经有很多成功的案例了。主要关注该论文是如何预测顶点坐标的。其实大概想想,就能够大致确定直接预测顶点坐标是有不少困难的。首先是,你不能把所有的顶点拉成一个向量,用全连接层预测;要用卷积层作为输出的话,mesh又不能直接表示成一个固定大小的张量(这正好是用cnn来预测所需要解决的问题,比如将mesh立方体化)。...
2018-03-22 17:38:02 5846 29
原创 3D【8】鸟类重建:Learning Category-Specific Mesh Reconstruction from Image Collections阅读笔记
该文章直接预测的是平均mesh的坐标偏差,相机参数和纹理uv图。里面有各种损失函数,很值得学习。这篇论文还有个有意思的点,论文用的训练数据是没有对应的3D模型的(也就是一张图片没有对应的3D模型)。训练过程有点像3DMM的重建过程,即先估计3D模型,将模型渲染到2D;然后比较渲染的图片和原始图片的差异,以更新模型的参数。要将这个过程应用在神经网络中,由于渲染是不可导的,因此需要解决渲染这一步骤...
2018-03-22 11:43:17 1702
原创 3D【7】人脸重建:Hands on Shape from Shading阅读笔记
Shape from Shading(sfs)是一个很基础也很经典的3D重建方法。其基本原理是利用灰度图片的亮度信息,加上亮度生成原理,求得每个像素在3D空间中的法向量,最终根据法向量求得深度信息。 看了不少相关的文章,感觉这篇论文讲的最好懂,里面还有相应的matlab代码。所以想学sfs的同学,可以去看这篇论文。问题描述一张灰度图的亮度信息由4个因素决定: 1、光照:主要是方向,...
2018-03-17 16:27:05 5445 9
原创 3D【6】人脸重建:Multilinear Autoencoder for 3D Face Model Learning
该论文输入的是一个扫描的3d mesh,输出是一个顶点数的3d mesh。这个过程很像NICP的3d人脸配准过程,但是NICP是一个优化的过程。而该方法在学习好了网络后,可以直接使用。使用GPU的话,速度应该可以非常快。该论文还为利用CNN重建3D人脸提供了另一种思路。目前看到的用CNN进行3D人脸重建,其输出要么是3DMM的系数(没有人脸的真是深度信息),要么是将mesh立方体化(一个n1×...
2018-03-14 10:59:27 3034
原创 3D【5】人脸重建:Learning the Multilinear Structure of Visual Data阅读笔记
该论文主要内容是使用张量分解来表征一个3D人脸,如下公式: 其中B(1)B(1)B_{(1)} 是通过大量数据学习出来的,而A(m)A(m)A^{(m)} 则是重构出 XXX 的系数,⊙⊙\odot 是克罗内克积。克罗内克积:一个3×1的向量和一个4×1的向量进行克罗内克积,会得到12×1的向量。具体的可参考wiki。每个A(m)A(m)A^{(m)} 可以表示不同的大分类,比如光...
2018-03-12 17:14:21 947 3
原创 深度学习【26】wavenet-歌声合成
论文:A NEURAL PARAMETRIC SINGING SYNTHESIZER 完整论文:A Neural Parametric Singing Synthesizer Modeling Timbre and Expression from Natural Songs 之前研究过一段时间的wavenet语音合成。第一版wavenet的一个最大的问题是合成非常耗时,但是就有尝试过各种方案...
2018-03-08 14:16:45 5539
原创 Symbol lookup error: /usr/lib/libblas.so.3: undefined symbol: gotoblas
在安装lsfm时候遇到的一个问题,这个问题是因为conda使用的是libblas而不是openblas引起的。可以删除系统的openblas,但是这样做不好。sudo apt-get remove libopenblas-base我们直接安装一个conda的openblas就可以了:conda install -c anaconda libopenblas...
2018-03-06 08:51:08 4444
原创 深度学习【25】物体检测:Tiny SSD
论文:Tiny SSD: A Tiny Single-shot Detection Deep Convolutional Neural Network for Real-time Embedded Object Detection 记录这篇论文的原因主要是想记录一下在优化yolov2时所用的网络。该论文将SSD模型优化到只有2.3M,同时在voc 2007[评测数据集上面的mAP比tiny yo
2018-03-03 15:26:31 2537 6
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人