代码:
#因为我使用的是tensorflow2.0所以使用1,2两行代替import tensorflow as tf
#下面三行加入相应的库
import tensorflow.compat.v1 as tf #1
tf.disable_v2_behavior() #2
import numpy as np
import matplotlib.pyplot as plt
#使用numpy生成200个随机点
#在-0.5~0.5之间等差的获得200个点,默认是生成50个
#[:,np.newaxis]使行向量变为列向量200*1
x_data = np.linspace(-0.5,0.5,200)[:,np.newaxis]
#生成一个正态分布,并且把数据填入一个和x_data一样200*1向量里。其中0是均值0.02是方差
noise = np.random.normal(0,0.02,x_data.shape)
#np.square()计算括号内各个元素的平方。还是得到200*1的列向量
y_data = np.square(x_data) + noise
#定义两个placeholder
x = tf.placeholder(tf.float32,[None,1])
y = tf.placeholder(tf.float32,[None,1])
#定义神经网络中间层
#变量Weights_L1为一个1*10大小的矩阵,矩阵中的元素是从(0,1)分布中随机取出的10个数
Weights_L1 = tf.Variable(tf.random_normal([1,10]))
#变量biases_L1为一个1*10大小的内部元素为0的矩阵
biases_L1 = tf.Variable(tf.zeros([1,10]))
#进行矩阵相乘X*W+b得到200*10的矩阵
Wx_plus_b_L1 = tf.matmul(x,Weights_L1) + biases_L1
#对得到的值使用激活函数,因为使用了激活函数所以本次的代码实现的是非线性
L1 = tf.nn.tanh(Wx_plus_b_L1)
#定义神经网络输出层
Weights_L2 = tf.Variable(tf.random_normal([10,1]))
biases_L2 = tf.Variable(tf.zeros([1,1]))
Wx_plus_b_L2 = tf.matmul(L1,Weights_L2) + biases_L2
prediction = tf.nn.tanh(Wx_plus_b_L2)
#二次代价函数
loss = tf.reduce_mean(tf.square(y-prediction))
#使用梯度下降法训练
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
with tf.Session() as sess:
#变量初始化
sess.run(tf.global_variables_initializer())
for _ in range(2000):
sess.run(train_step,feed_dict={x:x_data,y:y_data})
#获得预测值
prediction_value = sess.run(prediction,feed_dict={x:x_data})
#创建一个画布
plt.figure()
plt.scatter(x_data,y_data)#绘制散点图
plt.plot(x_data,prediction_value,'r-',lw=5)#绘制折线图,'r-'表示绘制的是实线图
plt.show()
函数
[:, np.newaxis]
np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
start:scalar
起始点
stop:scalar
终止点
num : int, optional
默认50,生成start和stop之间50个等差间隔的元素
endpoint : bool, optional
如果为ture生成等差间隔的元素,但是不包含stop,即间隔为 (stop - start)/num
retstep : bool, optional
如果为true返回一个(array,num)元组,array是结果数组,num是间隔大小
dtype : dtype, optional
输出数组的类型。如果没有给出dtype,则从其他输入参数推断数据类型。
np.random.normal()
numpy.random.normal(loc=0,scale=1e-2,size=shape)
-
参数loc(float):正态分布的均值,对应着这个分布的中心。loc=0说明这一个以Y轴为对称轴的正态分布,
-
参数scale(float):正态分布的标准差,对应分布的宽度,scale越大,正态分布的曲线越矮胖,scale越小,曲线越高瘦。
-
参数size(int 或者整数元组):输出的值赋在shape里,默认为None。
tf.random_normal()
tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None) -
shape: 输出张量的形状,必选
-
mean: 正态分布的均值,默认为0
-
stddev: 正态分布的标准差,默认为1.0
-
dtype: 输出的类型,默认为tf.float32
-
seed: 随机数种子,是一个整数,当设置之后,每次生成的随机数都一样
-
name: 操作的名称
结果