自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

DCD_LIN的博客

一天不学习,浑身难受。

  • 博客(13)
  • 资源 (4)
  • 收藏
  • 关注

原创 博客目录

深度学习深度学习【1】ubuntu中利用h5py保存训练好的keras 神经网络模型 深度学习【2】Batch Normalization 论文翻译 深度学习【3】keras:保存keras学习好的深度神经网络模型参数为二进制和txt文件 深度学习【4】基于深度循环神经网络(DRNN)的单通道音乐人声分离 深度学习【5】循环神经网络(RNN)反向传播算法(BPTT)理解 深度学习【6...

2018-03-08 16:51:58 1256

原创 深度学习【28】pytorch 遇到RuntimeError: input is not contiguous

遇到这个问题一般是使用了view或者index_select函数,解决方法:data = data.view(bsz, -1).t().contiguous()#只要在view函数后面再加个contiguous()就ok

2018-03-31 16:31:55 6626

原创 深度学习【27】pytorch Variable变量方法的使用

这边记录一些Variable变量相关的一些方法。将一个numpy的张量转成Variable:Vtensor = torch.autograd.Variable(torch.LongTensor(np.int64(np.asarray(nptensor))))##torch.LongTensor确定变量类型,根据需要更改类似reshape操作:out = output...

2018-03-31 16:27:51 2113

原创 cmake调用opencv、dlib和mxnet

cmake_minimum_required(VERSION 3.6)project(imgClassification)set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++11")set(SOURCE_FILES main.cpp)find_package(OpenCV REQUIRED) #查找opencv包,需提前安装add_lib...

2018-03-31 16:01:15 926

原创 3D【10】网格优化:Laplacian Mesh Optimization

拉普拉斯网格优化与平滑是网格处理的经典算法,其一些基本概念可以作为神经网络预测3D mesh的一些约束,如平滑。我们先来看看一些基本概念。基本概念首先,我们用G=(V,E)G=(V,E)G=(V,E) 来表示一个网格。 其中V=[vT1,vT2,...,vTn]T,vi=[vix,viy,viz]T∈R3V=[v1T,v2T,...,vnT]T,vi=[vix,viy,viz]T∈R...

2018-03-29 14:18:57 5318 4

原创 3D【9】人脸重建:Joint3D Face Reconstruction and Dense Alignment with Position Map Regression

该论文同时预测人脸特征点和3D mesh的顶点坐标x,y,z。人脸特征点没什么好说的,现在已经有很多成功的案例了。主要关注该论文是如何预测顶点坐标的。其实大概想想,就能够大致确定直接预测顶点坐标是有不少困难的。首先是,你不能把所有的顶点拉成一个向量,用全连接层预测;要用卷积层作为输出的话,mesh又不能直接表示成一个固定大小的张量(这正好是用cnn来预测所需要解决的问题,比如将mesh立方体化)。...

2018-03-22 17:38:02 5846 29

原创 3D【8】鸟类重建:Learning Category-Specific Mesh Reconstruction from Image Collections阅读笔记

该文章直接预测的是平均mesh的坐标偏差,相机参数和纹理uv图。里面有各种损失函数,很值得学习。这篇论文还有个有意思的点,论文用的训练数据是没有对应的3D模型的(也就是一张图片没有对应的3D模型)。训练过程有点像3DMM的重建过程,即先估计3D模型,将模型渲染到2D;然后比较渲染的图片和原始图片的差异,以更新模型的参数。要将这个过程应用在神经网络中,由于渲染是不可导的,因此需要解决渲染这一步骤...

2018-03-22 11:43:17 1702

原创 3D【7】人脸重建:Hands on Shape from Shading阅读笔记

Shape from Shading(sfs)是一个很基础也很经典的3D重建方法。其基本原理是利用灰度图片的亮度信息,加上亮度生成原理,求得每个像素在3D空间中的法向量,最终根据法向量求得深度信息。 看了不少相关的文章,感觉这篇论文讲的最好懂,里面还有相应的matlab代码。所以想学sfs的同学,可以去看这篇论文。问题描述一张灰度图的亮度信息由4个因素决定: 1、光照:主要是方向,...

2018-03-17 16:27:05 5445 9

原创 3D【6】人脸重建:Multilinear Autoencoder for 3D Face Model Learning

该论文输入的是一个扫描的3d mesh,输出是一个顶点数的3d mesh。这个过程很像NICP的3d人脸配准过程,但是NICP是一个优化的过程。而该方法在学习好了网络后,可以直接使用。使用GPU的话,速度应该可以非常快。该论文还为利用CNN重建3D人脸提供了另一种思路。目前看到的用CNN进行3D人脸重建,其输出要么是3DMM的系数(没有人脸的真是深度信息),要么是将mesh立方体化(一个n1×...

2018-03-14 10:59:27 3034

原创 3D【5】人脸重建:Learning the Multilinear Structure of Visual Data阅读笔记

该论文主要内容是使用张量分解来表征一个3D人脸,如下公式: 其中B(1)B(1)B_{(1)} 是通过大量数据学习出来的,而A(m)A(m)A^{(m)} 则是重构出 XXX 的系数,⊙⊙\odot 是克罗内克积。克罗内克积:一个3×1的向量和一个4×1的向量进行克罗内克积,会得到12×1的向量。具体的可参考wiki。每个A(m)A(m)A^{(m)} 可以表示不同的大分类,比如光...

2018-03-12 17:14:21 947 3

原创 深度学习【26】wavenet-歌声合成

论文:A NEURAL PARAMETRIC SINGING SYNTHESIZER 完整论文:A Neural Parametric Singing Synthesizer Modeling Timbre and Expression from Natural Songs 之前研究过一段时间的wavenet语音合成。第一版wavenet的一个最大的问题是合成非常耗时,但是就有尝试过各种方案...

2018-03-08 14:16:45 5539

原创 Symbol lookup error: /usr/lib/libblas.so.3: undefined symbol: gotoblas

在安装lsfm时候遇到的一个问题,这个问题是因为conda使用的是libblas而不是openblas引起的。可以删除系统的openblas,但是这样做不好。sudo apt-get remove libopenblas-base我们直接安装一个conda的openblas就可以了:conda install -c anaconda libopenblas...

2018-03-06 08:51:08 4444

原创 深度学习【25】物体检测:Tiny SSD

论文:Tiny SSD: A Tiny Single-shot Detection Deep Convolutional Neural Network for Real-time Embedded Object Detection 记录这篇论文的原因主要是想记录一下在优化yolov2时所用的网络。该论文将SSD模型优化到只有2.3M,同时在voc 2007[评测数据集上面的mAP比tiny yo

2018-03-03 15:26:31 2537 6

语音增强:理论与实践.rar

经典书籍:《语音增强:理论与实践》中的matlab代码。

2018-02-06

Neural Networks Tricks of the Trade

Neural Networks Tricks of the Trade

2017-08-25

各大高校《数据结构》考研历年真题

这是各大高校《数据结构》考研历年真题,希望对同学们有帮助

2014-08-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除