上周在搜索关于深度学习分布式运行方式的资料时,无意间搜到了paddlepaddle,发现这个框架的分布式训练方案做的还挺不错的,想跟大家分享一下。不过呢,这块内容太复杂了,所以就简单的介绍一下paddlepaddle的第一个“hello word”程序----mnist手写数字识别。下一次再介绍用PaddlePaddle做分布式训练的方案。其实之前也写过一篇用CNN识别手写数字集的文章(链接戳这里~),是用keras实现的,这次用了paddlepaddle后,正好可以简单对比一下两个框架的优劣。
什么是PaddlePaddle?
PaddlePaddle是百度推出的一个深度学习框架,可能大多数人平常用的比较多的一般是tensorflow,caffe,mxnet等,但其实PaddlePaddle也是一个非常不错的框架(据说以前叫Paddle,现在改名叫PaddlePaddle,不知道为啥总觉得有股莫名的萌点)
PaddlePaddle能做什么?
传统的基本都能做,尤其对NLP的支持很好,譬如情感分析,word embedding,语言模型等,反正你想得到的,常见的都可以用它来试一试~
PaddlePaddle的安装
不得不吐槽一下PaddlePaddle的安装,官网上说“PaddlePaddle目前唯一官方支持的运行的方式是Docker容器”,而docker其实在国内还并不是特别的流行,之前遇到的所有的框架,都有很多种安装方式,非常方便,所以这个唯一支持docker让人觉得非常诡异 = =!不过偶然试了一下,居然可以用pip install,不过为啥官网上没有写呢?所以,对于新手来说,最简单的安装方式就是:
CPU版本安装
pip install paddlepaddle
GPU版本安装
pip install paddlepaddle-gpu
用PaddlePaddle实现手写数字识别
训练步骤
传统的方式这次就不展开讲了,为了对比我们还是用CNN来进行训练。PaddlePaddle训练一次模型完整的过程可以如下几个步骤:
导入数据---->定义网络结构---->训练模型---->保存模型---->测试结果
下面,我直接用代码来展示训练的过程(以后代码都会放在github里):
#coding:utf-8
importosfrom PIL importImageimportnumpy as npimportpaddle.v2 as paddle#设置是否用gpu,0为否,1为是
with_gpu = os.getenv('WITH_GPU', '0') != '1'
#定义网络结构
defconvolutional_neural_network_org(img):#第一层卷积层
conv_pool_1 =paddle.networks.simple_img_conv_pool(
input=img,
filter_size=5,
num_filters=20,
num_channel=1,
pool_size=2,
pool_stride=2,
act=paddle.activation.Relu())#第二层卷积层
conv_pool_2 =paddle.networks.simple_img_conv_pool(
input=conv_pool_1,
filter_size=5,
num_filters=50,
num_channel=20,
pool_size=2,
pool_stride=2,
act=paddle.activation.Relu())#全连接层
predict =paddle.layer.fc(
input=conv_pool_2, size=10, act=paddle.activation.Softmax())returnpredictdefmain():#初始化定义跑模型的设备
paddle.init(use_gpu=with_gpu, trainer_count=1)#读取数据
images =paddle.layer.data(
name='pixel', type=paddle.data_type.dense_vector(784))
label=paddle.layer.data(
name='label', type=paddle.data_type.integer_value(10))#调用之前定义的网络结构
predict =convolutional_neural_network_org(images)#定义损失函数
cost = paddle.layer.classification_cost(input&