深度学习神经网络 Tensorflow参数优化 之 正则化 第二部分,正则化程序

首先是用来训练的会话:

#定义反向传播方法:不含正则化
train_step = tf.train.AdamOptimizer(0.0001).minimize(loss_mse)

with tf.Session() as sess:
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    STEPS = 40000
    for i in range(STEPS):
        start = (i*BATCH_SIZE)%300
        end = start + BATCH_SIZE
        sess.run(train_step,feed_dict={x:X[start:end],y_:Y_[start:end]})
        if i % 2000 == 0:
            loss_mse_v = sess.run(loss_mse,feed_dict={x:X,y_:Y_})
            print("After " + str(i)+ " steps, loss is: " + str(loss_mse_v))

无论是正则化也好,无正则化程序也好,训练步骤基本上都是这样,正则化程序无非是改改 train_step 罢了:

#定义反向传播方法:包含正则化
train_step = tf.train.AdamOptimizer(0.0001).minimize(loss_total)

以及每2000次打印的程序:

            loss_total_v = sess.run(loss_total,feed_dict={x:X,y_:Y_})
            print("After " + str(i)+ " steps, loss is: " + str(loss_total_v))

通过训练,我们得到了目标网络参数。

之后我们要把一些数据放进去训练,然后把结果用来标注:

    #xx在-3到3之间以步长为0.01,yy在-3到3之间以步长为0.01,生成二维网格坐标点
    xx,yy = np.mgrid[-3:3:.01,-3:3:.01]
    #将xx,yy拉直,并合并成一个2列的矩阵,得到一个网格坐标点的集合
    grid = np.c_[xx.ravel(),yy.ravel()]
    #将网格坐标点喂入神经网络,probs为输出
    probs = sess.run(y,feed_dict={x:grid})
    #probs的shape调整成xx的样子
    probs = probs.reshape(xx.shape)
    print("w1: "+ str(sess.run(w1)))
    print("b1: "+ str(sess.run(b1)))
    print("w2: " + str(sess.run(w2)))
    print("b2: " + str(sess.run(b1)))

plt.scatter(X[:,0],X[:,1],c=np.squeeze(Y_c))
plt.contour(xx,yy,probs,levels=[.5])
plt.show()

这里有个地方比较难理解,我们详细说一下:

    #xx在-3到3之间以步长为0.01,yy在-3到3之间以步长为0.01,生成二维网格坐标点
    xx,yy = np.mgrid[-3:3:.01,-3:3:.01]
    #将xx,yy拉直,并合并成一个2列的矩阵,得到一个网格坐标点的集合
    grid = np.c_[xx.ravel(),yy.ravel()]

首先是第一行,生成二维网格坐标点,我们把xx,yy分别打印。得到如下结果:

[[-3.   -3.   -3.   ... -3.   -3.   -3.  ]
 [-2.99 -2.99 -2.99 ... -2.99 -2.99 -2.99]
 [-2.98 -2.98 -2.98 ... -2.98 -2.98 -2.98]
 ...
 [ 2.97  2.97  2.97 ...  2.97  2.97  2.97]
 [ 2.98  2.98  2.98 ...  2.98  2.98  2.98]
 [ 2.99  2.99  2.99 ...  2.99  2.99  2.99]]


[[-3.   -2.99 -2.98 ...  2.97  2.98  2.99]
 [-3.   -2.99 -2.98 ...  2.97  2.98  2.99]
 [-3.   -2.99 -2.98 ...  2.97  2.98  2.99]
 ...
 [-3.   -2.99 -2.98 ...  2.97  2.98  2.99]
 [-3.   -2.99 -2.98 ...  2.97  2.98  2.99]
 [-3.   -2.99 -2.98 ...  2.97  2.98  2.99]]

可以看到,上面的x每行数都是相同的,对于下面y每行逐步增加0.01。

我们用第二行程序把它们拉直,就变成了如下所示的数据:

[[-3.   -3.  ]
 [-3.   -2.99]
 [-3.   -2.98]
 ...
 [ 2.99  2.97]
 [ 2.99  2.98]
 [ 2.99  2.99]]

就是-3到3上每隔0.01所有的网格点了。我们把这些网格点放进训练好的网络中,就能得到结果。

probs = sess.run(y,feed_dict={x:grid})

然后调整输出的probs的格式:

    #probs的shape调整成xx的样子
    probs = probs.reshape(xx.shape)

probs的形状要和xx,yy一样,因为待会我们画坐标点的时候就是要根据xx,yy作为坐标来画的。现在的probs里面的数据都是0到1之间的小数。我们判断依据是大于0.5的时候表示在圆内,小于0.5的时候不在圆内。

plt.contour(xx,yy,probs,levels=[.5])

这个函数主要对网格中每个点的值等于level的时候做出轮廓线,相当于把大于level和小于level的部分分隔开。

得到的最终结果如图所示:左边是不使用正则化的训练结果,右边是使用正则化以后的训练结果。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
《Python深度学习(第2版)PDF》是一本广受欢迎的深度学习入门教材。它是由弗朗索瓦·肖莱(Francois Chollet)编写的,他是Keras的创始人之一。这本书以Python为工具,系统地介绍了深度学习的基本原理和实践技巧。 在这本书中,读者将学习如何使用Python编写神经网络模型,并利用常见的深度学习库如Keras和TensorFlow进行模型训练和评估。通过逐步的实践项目,读者能够理解神经网络的组成和工作原理,以及如何使用Python实现各种深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)和生成对抗网络(GAN)等。 此外,这本书还介绍了深度学习中的常用技巧和策略,如优化算法、正则化、超参数调优等。读者可以通过实践项目来学习和掌握这些技巧,并将它们应用到自己的深度学习实践中。 《Python深度学习(第2版)PDF》在广大读者中非常受欢迎,因为它用简洁明了的语言讲解了深度学习的复杂概念,并提供了丰富的示例代码和实践项目。这本书适合初学者入门使用,也适合那些想要深入了解深度学习原理和实践技巧的读者。无论是学生、研究者、开发者还是对人工智能感兴趣的人,都会从中受益匪浅。 总之,对于想要学习深度学习的读者来说,《Python深度学习(第2版)PDF》是一本非常值得阅读的参考书,它将帮助读者入门深度学习并提供实践经验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Dezeming

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值