我选择tensorFlow作为我学习的第一个神经网络框架,恰巧最近Tensorflow支持了windows,所以让我的学习变得更加便捷。
我的主要参考文章有
http://blog.csdn.net/u014595019/article/details/52677412
https://mp.weixin.qq.com/s/6H2FkNQSZ-qp3u5_FN5UoA
http://wiki.jikexueyuan.com/project/tensorflow-zh/
一、TensorFlow的运行流程
TensorFlow运行流程分为两步,分别是构造模型和训练。
在构造阶段,我们需要去构建一个图(Graph)来描述我们的模型,然后在session中启动它。所谓图,可以理解为流程图,就是将数据的输入输出的过程表示出来
但是此时是不会发生实际运算的,因为TensorFlow是【延迟执行(deferred execution)】模型,它必须知道你要计算什么,你的执行图,然后才开始发送计算任务到各种计算机。所以你首先使用TensorFlow函数在内存中创造一个计算图,然后启动一个执行session并且使用session.run执行实际训练任务,如梯度计算等操作,在此时,图无法被改变。
1.1基本概念
1.1.1 Tensor
Tensor的意思就是张量,我的理解就是一个维数不定的矩阵,也可以理解为tensorflow中矩阵的表示形式,tensor的生成方式有很多种,之后再详细总结,举个例子
import tensorflow as tf
a=tf.zeros(shape=[1,2])
注意:在session.run之前,所有数据都是抽象的概念,也就是说,a此时只是表示这应该是一个1*2的零矩阵,但却没有实际赋值,所以如果此时print(a),就会出现如下情况:
print(a)
#==>Tensor("zeros:0", shape=(1, 2