第一次自己敲tensorflow的代码,当然是最简单的一元线性回归的例子。
下面是完整的代码和注释
#使用matplotlib显示图像
#选择模型y=2x+1单变量线性回归,随机梯度下降法(批量为1)
#%matplotlib inline #jupyter notebook中如果要显示图片则要设置为inline模式
import matplotlib.pyplot as plt #载入matplotlib
import numpy as np #载入numpy
import tensorflow as tf #载入tensorflow
#将节点使用tensorboard展示出来
tf.reset_default_graph() #清空之前的计算图
#设置随机数种子,用来生成样本的噪声
np.random.seed(10)
#在-1到1之间平均取100个x点来求y
x_data = np.linspace(-1,1,100)
#生产样本点,样本点应该在标准模型下受噪声影响
#randn生成一个n阶的随机噪声,符合正太分布,均值为0,均方差为1
#x_data.shape的值是一个元组(100,)前面加*x_data.shape则表示顺序取出元组中值
#此处就等于randn(100)
y_data = 2*x_data+1.0+np.random.randn(*x_data.shape)*0.4
'''
#生成噪点图
plt.scatter(x_data,y_data)
#生成标准曲线
plt.plot(x_data,1.0+2*x_data,color = 'red',linewidth ='3')
#显示图形
plt.show()
'''
#使用tensorflow来求解神经网络参数
#定义两个占位符,x是样本属性,y是样本值,用来接收x_data和y_data
x=tf.placeholder("float",name="x")
y=tf.placeholder("float",name="y")
#定义模型y=wx+b
def model(x,w,b):
return tf.multiply(x,w)+b
#定义两个变量w和b
#此处给了初值1和0,初值是可以任意取的
w = tf.Variable(1.0,name="w0")
b = tf.Variable(0.0,name="b0")
#pred根据模型求出来的预测值
pred = model(x,w,b)
#定义训练次数
train_epochs = 10
#定义训练步长
learning_rate = 0.05
#定义损失函数,此处使用均方差L2作为损失函数
loss_function = tf.reduce_mean(tf.square(y-pred))
#定义优化器,使用梯度下降法求解,最小化损失函数为目标
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss_function)
sess = tf.InteractiveSession()
init = tf.global_variables_initializer()
sess.run(init)
#开始训练
step = 0 #记录训练步数
loss_list = [] #记录损失值
display_step=10#控制报告的粒度
for epoch in range(train_epochs):
#分别从样本中取出标准数据
for xs,ys in zip(x_data,y_data):
#根据每一个样本来运行优化器
_, loss = sess.run([optimizer,loss_function],feed_dict={x:xs,y:ys})
#显示损失值loss
#例如,如果display_step设置为2,则将每训练2个样本输出一次顺势值
#与超参数不同,修改display_step不会更改模型所学习的规律
loss_list.append(loss)
step = step + 1
if step % display_step == 0:
print("Train Epoch:",'%02d'%(epoch+1),"Step: %03d"%(step),"loss=","{:.9f}".format(loss))
#每次训练得到的b值和w值
b0temp = b.eval(session=sess)
w0temp = w.eval(session=sess)
plt.plot(x_data,w0temp*x_data+b0temp)#完成绘图
#利用模型,进行预测
x_test = 3.22
#通过pred节点来进行预测
predict = sess.run(pred,feed_dict={x:x_test})
print("预测值:%f" % predict)
target = 2*x_test+1.0
print("目标值:%f" % target)
#将计算图日志保存
logdir = 'D:\log'
#使用writer写入
writer = tf.summary.FileWriter(logdir,tf.get_default_graph())
writer.close()
plt.show()
可以改进的部分
1、单个训练可以改成批量训练
2、每轮训练后为了防止假性结果,应该使用shuffle打乱训练集顺序
现在是在跟着吴明晖老师的课程在学习,后面还会有更多机器学习代码案例分享。