工具
为了管理python环境,需要使用conda,virtualenv之类的环境管理软件,方便切换各个版本,以及维护不同目的的环境。
选择深度学习软件
为了使用深度学习算法,我需要找到一个功能复杂、较新的深度学习软件。从框架角度,较好的选择是Theano和Caffe。Theano显得过于基础,Caffe又显得过于僵硬。
后来定下来使用Pylearn2,这是一个建立在Thenao之上的机器学习软件。
学习Pylearn2,从阅读tutorial开始。
Pylearn2 tutorial:
RBM with Gaussian function trained on cifar-10
Pylearn2官方在Quick-start中用到的例子就是在cifar-10数据集中使用高斯函数RBM训练模型。
简单按照教程走下来之后,完整的训练了一次模型。训练出来的filters结果如下:
过程中遇到了PIL安装的困难,报错缺少文件。
error: no such file or directory: 'build/temp.macosx-10.10-intel-2.7/_imagingtk.o'
有人分析是因为pillow的bug造成的。另外有人指出可以通过以下办法解决:
sudo apt-get build-dep python-imaging
这个命令编译了python-imaging
的依赖项。