02. tensorflow基础(二)

1. 变量

  • 变量也是一种OP,是一种特殊的张量,能够进行存储持久化,它的值就是张量

1.1. 变量的创建

  • tensorflow1.15
import tensorflow as tf


a = tf.constant([1,2,3,4,5])
var = tf.Variable(tf.random_normal([2,3], mean=0.0, stddev=1.0))
# 做一步显示的初始化
init_op = tf.global_variables_initializer()

with tf.Session() as sess:
    # 必须运行初始化op
    sess.run(init_op)
    print(sess.run([a, var]))

  • tensorflow2.0貌似发生了变化

1.2. 可视化学习Tensorboard

  • 数据序列化-events文件

    • TensorBoard 通过读取 TensorFlow 的事件文件来运行
  • tf.summary.FileWriter(’/tmp/tensorflow/summary/test/’,graph=default_graph)

    • 返回filewriter,写入事件文件到指定目录(最好用绝对路径),以提供给tensorboard使用
  • 开启

    • tensorboard --logdir=/tmp/tensorflow/summary/test/
  • 注:修改程序后,再保存一遍会有新的事件文件,打开默认为最新

  • 代码实现

    • tensorflow1.15
    import tensorflow as tf
    
    
    a = tf.constant(3.0, name="a")
    b = tf.constant(4.0, name="b")
    c = tf.add(a, b, name="add")
    
    var = tf.Variable(tf.random_normal([2,3], mean=0.0, stddev=1.0), name="var")
    # 做一步显示的初始化
    init_op = tf.global_variables_initializer()
    
    with tf.Session() as sess:
        # 必须运行初始化op
        sess.run(init_op)
        
        # 程序的图结构写入事件文件, graph: 把指定的图写进事件文件
        file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
        print(sess.run([c, var]))
    
    
    • tensorboard截图
      在这里插入图片描述

2. tensorflow实现一个简单的线性回归案例

import tensorflow as tf


# 自实现一个线性回归预测
# 1. 准备数据, x特征值[100, 1] y 目标值【100】
x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
# 假设的真实值 矩阵相乘必须是二维的
y_true = tf.matmul(x, [[0.7]]) + 0.8


# 2.建立线性回归模型, 一个特征,一个权重, 一个偏置y = x w + b
# 随机给一个权重和偏置的值,让他计算损失,然后在当前状态下优化
weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
bias = tf.Variable(0.0, name="b")

y_predict = tf.matmul(x, weight) + bias


# 3. 建立损失函数,均方误差
loss = tf.reduce_mean(tf.square(y_true-y_predict))


# 4. 梯度下降优化损失 learning_rate: 0~1 学习率不能够太大
train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)


# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()


with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为:%f,偏置为:%f' % (weight.eval(), bias.eval()))
    
    # 循环训练,运行优化
    for i in range(500):
        sess.run(train_op)
        print('第%d步参数权重为:%f,偏置为:%f' % (i, weight.eval(), bias.eval()))

3. 关于梯度爆炸、梯度消失

  • 在极端的情况下, 权重的值变得非常大, 以至于溢出,导致NAN值

  • 如何解决梯度爆炸?(深度神经网络如RNN当中更容易出现)

    • 重新设计神经网络
    • 调整学习率
    • 使用梯度截断(在训练过程中检查和限制梯度的大小)
    • 使用激活函数

4. tensorflow变量作用域

  • 让模型代码更加清晰,作用分明
  • 代码实现
import tensorflow as tf

with tf.variable_scope('data'):
    # 自实现一个线性回归预测
    # 1. 准备数据, x特征值[100, 1] y 目标值【100】
    x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
    # 假设的真实值 矩阵相乘必须是二维的
    y_true = tf.matmul(x, [[0.7]]) + 0.8

with tf.variable_scope('model'):
    # 2.建立线性回归模型, 一个特征,一个权重, 一个偏置y = x w + b
    # 随机给一个权重和偏置的值,让他计算损失,然后在当前状态下优化
    weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
    bias = tf.Variable(0.0, name="b")

    y_predict = tf.matmul(x, weight) + bias

with tf.variable_scope('loss'):
    # 3. 建立损失函数,均方误差
    loss = tf.reduce_mean(tf.square(y_true-y_predict))

with tf.variable_scope('optimizer'):
    # 4. 梯度下降优化损失 learning_rate: 0~1
    train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)


# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()

with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    # 将程序的图结构写入事件文件, graph: 把指定的图写进事件文件
    file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
    
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为:%f,偏置为:%f' % (weight.eval(), bias.eval()))
    
    # 循环训练,运行优化
    for i in range(500):
        sess.run(train_op)
        print('第%d步参数权重为:%f,偏置为:%f' % (i, weight.eval(), bias.eval()))
  • tensorboard截图
    在这里插入图片描述

5. 增加损失值等变量显示

  • 目的:观察模型的参数、损失值等变量的变化

  • 收集变量

    • tf.summary.scalar(name=’’,tensor) 收集对于损失函数和准确率
    • 等单值变量,name为变量的名字,tensor为值
    • tf.summary.histogram(name=‘’,tensor) 收集高维度的变量参数
    • tf.summary.image(name=‘’,tensor) 收集输入的图片张量能显示图片
  • 合并变量写入事件文件

    • merged = tf.summary.merge_all()
    • 运行合并:summary = sess.run(merged),每次迭代都需运行
    • 添加:FileWriter.add_summary(summary,i),i表示第几次的值
  • 代码实现

import tensorflow as tf

with tf.variable_scope('data'):
    # 自实现一个线性回归预测
    # 1. 准备数据, x特征值[100, 1] y 目标值【100】
    x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
    # 假设的真实值 矩阵相乘必须是二维的
    y_true = tf.matmul(x, [[0.7]]) + 0.8

with tf.variable_scope('model'):
    # 2.建立线性回归模型, 一个特征,一个权重, 一个偏置y = x w + b
    # 随机给一个权重和偏置的值,让他计算损失,然后在当前状态下优化
    weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
    bias = tf.Variable(0.0, name="b")

    y_predict = tf.matmul(x, weight) + bias

with tf.variable_scope('loss'):
    # 3. 建立损失函数,均方误差
    loss = tf.reduce_mean(tf.square(y_true-y_predict))

with tf.variable_scope('optimizer'):
    # 4. 梯度下降优化损失 learning_rate: 0~1
    train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)

# 收集tensor
tf.summary.scalar("losses", loss)
tf.summary.histogram("weights", weight)

# 定义合并tensor的op
merged = tf.summary.merge_all()

# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()

with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    
    # 将程序的图结构写入事件文件, graph: 把指定的图写进事件文件
    file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
    
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为:%f,偏置为:%f' % (weight.eval(), bias.eval()))
    
    # 循环训练,运行优化
    for i in range(500):
        sess.run(train_op)
        
        # 运行合并的tensor
        summary = sess.run(merged)
        file_writer.add_summary(summary,i)
        
        print('第%d步参数权重为:%f,偏置为:%f' % (i, weight.eval(), bias.eval()))
  • tensorboard截图
    在这里插入图片描述
    在这里插入图片描述

6. 模型的保存与加载

  • f.train.Saver(var_list=None,max_to_keep=5)

    • var_list:指定将要保存和还原的变量。它可以作为一个dict或一个列表传递.
    • max_to_keep:指示要保留的最近检查点文件的最大数量。创建新文件时,会删除较旧的文件。如果无或0,则保留所有检查点文件。默认为5(即保留最新的5个检查点文件。)
  • 例如:

    • saver.save(sess, ‘/tmp/ckpt/test/model’)
    • saver.restore(sess, ‘/tmp/ckpt/test/model’)
    • 保存文件格式:checkpoint文件
  • 代码实现

import tensorflow as tf
import os

with tf.variable_scope('data'):
    # 自实现一个线性回归预测
    # 1. 准备数据, x特征值[100, 1] y 目标值【100】
    x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
    # 假设的真实值 矩阵相乘必须是二维的
    y_true = tf.matmul(x, [[0.7]]) + 0.8

with tf.variable_scope('model'):
    # 2.建立线性回归模型, 一个特征,一个权重, 一个偏置y = x w + b
    # 随机给一个权重和偏置的值,让他计算损失,然后在当前状态下优化
    weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
    bias = tf.Variable(0.0, name="b")

    y_predict = tf.matmul(x, weight) + bias

with tf.variable_scope('loss'):
    # 3. 建立损失函数,均方误差
    loss = tf.reduce_mean(tf.square(y_true-y_predict))

with tf.variable_scope('optimizer'):
    # 4. 梯度下降优化损失 learning_rate: 0~1
    train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)

# 收集tensor
tf.summary.scalar("losses", loss)
tf.summary.histogram("weights", weight)

# 定义合并tensor的op
merged = tf.summary.merge_all()

# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()

# 定义一个保存模型的实例
saver = tf.train.Saver()

with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    
    # 将程序的图结构写入事件文件, graph: 把指定的图写进事件文件
    file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
    
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为:%f,偏置为:%f' % (weight.eval(), bias.eval()))

    # 加载模型, 覆盖模型当中随机定义的参数, 从上次训练的参数结果
    # 检测其中的一个文件checkpoint是否存在
    if os.path.exists("./tmp/ckpt/checkpoint"):
        saver.restore(sess, "./tmp/ckpt/model")
    
    # 循环训练,运行优化
    for i in range(500):
        sess.run(train_op)
        
        # 运行合并的tensor
        summary = sess.run(merged)
        file_writer.add_summary(summary,i)
        
        print('第%d步参数权重为:%f,偏置为:%f' % (i, weight.eval(), bias.eval()))
        
        if i % 100 == 0:
            # 保存模型, model为模型的名字
            saver.save(sess, "./tmp/ckpt/model")
        

7. 自定义命令行参数

7.1. tf.app.flags,它支持应用从命令行接受参数, 可以用来指定集群配置等。在tf.app.flags下面有各种定义参数的类型

  • DEFINE_string(flag_name, default_value, docstring)
  • DEFINE_integer(flag_name, default_value, docstring)
  • DEFINE_boolean(flag_name, default_value, docstring)
  • DEFINE_float(flag_name, default_value, docstring)

7.2. tf.app.flags.,在flags有一个FLAGS标志,它在程序中可以调用到我们前面具体定义的flag_name

7.3. 通过tf.app.run()启动main(argv)函数

7.4. 代码实现

import tensorflow as tf
import os

# 定义命令行参数
# 1. 首先定义有哪些参数需要在运行时候指定
# 2. 程序当中获取定义命令行定义的参数
#  第一个参数:名字,默认值, 说明
tf.app.flags.DEFINE_integer("max_step",100, "模型训练的步数")
tf.app.flags.DEFINE_string("model_dir"," ", "模型的加载路径")
# 定义获取命令行参数名字
FLAGS = tf.app.flags.FLAGS

with tf.variable_scope('data'):
    # 自实现一个线性回归预测
    # 1. 准备数据, x特征值[100, 1] y 目标值【100】
    x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
    # 假设的真实值 矩阵相乘必须是二维的
    y_true = tf.matmul(x, [[0.7]]) + 0.8

with tf.variable_scope('model'):
    # 2.建立线性回归模型, 一个特征,一个权重, 一个偏置y = x w + b
    # 随机给一个权重和偏置的值,让他计算损失,然后在当前状态下优化
    weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
    bias = tf.Variable(0.0, name="b")

    y_predict = tf.matmul(x, weight) + bias

with tf.variable_scope('loss'):
    # 3. 建立损失函数,均方误差
    loss = tf.reduce_mean(tf.square(y_true-y_predict))

with tf.variable_scope('optimizer'):
    # 4. 梯度下降优化损失 learning_rate: 0~1
    train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)

# 收集tensor
tf.summary.scalar("losses", loss)
tf.summary.histogram("weights", weight)

# 定义合并tensor的op
merged = tf.summary.merge_all()

# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()

# 定义一个保存模型的实例
saver = tf.train.Saver()

with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    
    # 将程序的图结构写入事件文件, graph: 把指定的图写进事件文件
    file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
    
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为:%f,偏置为:%f' % (weight.eval(), bias.eval()))

    # 加载模型, 覆盖模型当中随机定义的参数, 从上次训练的参数结果
    # 检测其中的一个文件checkpoint是否存在
    if os.path.exists("./tmp/ckpt/checkpoint"):
        saver.restore(sess, FLAGS.model_dir)
    
    # 循环训练,运行优化
    for i in range(FLAGS.max_step):
        sess.run(train_op)
        
        # 运行合并的tensor
        summary = sess.run(merged)
        file_writer.add_summary(summary,i)
        
        print('第%d步参数权重为:%f,偏置为:%f' % (i, weight.eval(), bias.eval()))
        
        if i % 100 == 0:
            # 保存模型, model为模型的名字
            saver.save(sess, FLAGS.model_dir)
        

7.5. 运行命令

  • python demo2.py --max_step=500 --model_dir="./tmp/ckpt/model"

7.6. 测试截图

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值