写在最前
深度学习辣么火,感觉应该学习学习以免以后人家讲座什么的听不懂。因此想要从应用层面出发,学习学习,那就看看怎么用tensorflow(以下简称tf)做神经网络吧。这里看的是莫烦大大的视频,真心强烈安利:视频地址
Tensorflow 基础构架
本章主要讲解tensorflow主要的元素,其中包括会话session,变量variable,传入值placeholder,激励函数Activation Function。下面的代码是一个简单的tf程序的实例:
# coding:utf-8
import tensorflow as tf
import numpy as np
x_data = np.random.rand(100).astype(np.float32) # 生成100个随机数,类型是float32
y_data = x_data*0.1+0.3
Weights = tf.Variable(tf.random_uniform([1],-1.0,1.0)) # tf.Variable是用来生成tf变量,这里就是生成一个[-1,1]数
biases = tf.Variable(tf.zeros([1])) # zeros可以生成一个0
y = Weights*x_data+biases # 针对每个x算出y值
loss = tf.reduce_mean(tf.square(y-y_data)) # 计算loss 平方求平均
optimizer = tf.train.GradientDescentOptimizer(0.5) # 找个训练方法就是什么梯度下降之类的
train = optimizer.minimize(loss) # 训练,让loss最小
init = tf.initialize_all_variables() # 初始化所有的变量
sess = tf.Session() # 会话,贼重要
sess.run(init) # 啥也得run才可以
print sess.run(Weights)
for step in range(201):
sess.run(train)
if step % 20 == 0:
print step,sess.run(Weights),sess.run(biases)
会话Session
session是个执行命令的东西,用来执行tf图上的某个小的功能。就是啥也要用sess.run一下啦。这里演示一个简单的矩阵乘法:
# coding:utf-8
import tensorflow as tf
matrix1 = tf.constant([[3,3]])
matrix2 = tf.constant([[2],
[2]])
product = tf.matmul(matrix1,matrix2) # matrix multiply np.dot(m1,m2)
这里定义了两个矩阵,而product是两个矩阵相乘的结果。但是,只是这样是无法得到结果的。因此需要session来运行,有两种方法:
方法一:
sess = tf.Session()
result = sess.run(product)
print result
sess.close()
方法二:
with tf.Session() as sess: # 自动关
result2 = sess.run(product)
print result2
变量Variable
下面有个例子能直观表现sess.run和变量的作用。
state = tf.Variable(0,name='counter')
one = tf.constant(1)
new_value = tf.add(state,one) # state+1的值赋给new_value
update = tf.assign(state,new_value) # 更新state的值
init = tf.initialize_all_variables() # 必须初始化
with tf.Session() as sess:
sess.run(init)
for _ in range(3): # 更新3次
sess.run(update)
print sess.run(state)
这个方法输出1,2,3三个数。这可以看出,sess.run就是运行了一下update获得这个值。
placeholder
placeholder的作用就是先给数据占个位置,在需要的时候再传入。
# coding:utf8
import tensorflow as tf
import numpy as np
input1 = tf.placeholder(tf.float32)
input2 = tf.placeholder(tf.float32)
output = tf.mul(input1,input2)
with tf.Session() as sess:
print (sess.run(output,feed_dict={input1:[7.],input2:[2.]})) # placeholder和feed_dict是绑定的
显而易见,最后输出的值是14.
激励函数
这个激励函数通常是sigmoid函数,当然还有很多,自己google吧~
建造神经网络
最主要的函数就是add_layer()了,然后所有东西都在注释里了:
# coding:utf8
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
def add_layer(inputs,in_size,out_size,n_layer,activation_function=None):
layer_name = 'layer%s'% n_layer
with tf.name_scope(layer_name): # 意思是这个with里的元素被包括在scope里
with tf.name_scope('weights'):
Weights = tf.Variable(tf.random_normal([in_size,out_size]),name='W') # 就是建造一个数组,[行,列]
tf.histogram_summary(layer_name+'/weights',Weights) # 让weights
with tf.name_scope('biases'):
biases = tf.Variable(tf.zeros([1,out_size]) + 0.1,name='b')
tf.histogram_summary(layer_name+'/biases',biases)
with tf.name_scope('Wx'):
Wx_plus_b=tf.matmul(inputs,Weights) + biases # 计算一波
if activation_function is None: # 如果不指定激励函数
outputs = Wx_plus_b
else:
outputs = activation_function(Wx_plus_b) # 如果指定了激励函数
tf.histogram_summary(layer_name+'/outputs',outputs)
return outputs
x_data = np.linspace(-1,1,300)[:,np.newaxis] # 这个能生成300个数,后面中括号可以让它变成竖着的
noise = np.random.normal(0,0.05,x_data.shape) # 生成噪声点,这里是个正太分布,均值是0方差是0.05,和x_data一样的格式
y_data = np.square(x_data)-0.5+noise # 计算y
with tf.name_scope('inputs'):
xs = tf.placeholder(tf.float32,[None,1],name='x_input')
ys = tf.placeholder(tf.float32,[None,1],name='y_input')
l1 = add_layer(xs,1,10,n_layer=1,activation_function=tf.nn.relu) # 输入数据是xs,1个输入,10个输出,名字是1,激励函数是relu
predition = add_layer(l1,10,1,n_layer=2,activation_function=None) # 输入数据是l1的输出,10个输入,1个输出,名字是2,没激励函数
with tf.name_scope('loss'):
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys-predition),reduction_indices=[1]))
tf.scalar_summary('loss',loss)
with tf.name_scope('train'):
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
init = tf.initialize_all_variables()
sess = tf.Session()
merged = tf.merge_all_summaries()
writer = tf.train.SummaryWriter("logs/",sess.graph) # 将所有的图画到log里
sess.run(init)
fig = plt.figure() # 用这个画图
ax = fig.add_subplot(1,1,1) # 图片编号
ax.scatter(x_data,y_data) # 点的编号
plt.ion() # 不用停顿
plt.show() # 输出图片
for i in range(1000):
sess.run(train_step,feed_dict={xs:x_data,ys:y_data})
if i%50 == 0:
result = sess.run(merged,feed_dict={xs:x_data,ys:y_data})
writer.add_summary(result,i) # 每i步输出一个结果
try:
ax.lines.remove(lines[0]) # 去除上次的线
except Exception:
pass
#print sess.run(loss,feed_dict={xs:x_data,ys:y_data})
predition_value = sess.run(predition,feed_dict={xs:x_data}) # 预测值
lines = ax.plot(x_data,predition_value,'r-',lw=5) # 用红色,宽度为5的曲线的形式画出来预测曲线
plt.pause(0.1)