02. tensorflow基础（二）

最新推荐文章于 2023-03-20 20:25:15 发布

越奋斗，越幸运

最新推荐文章于 2023-03-20 20:25:15 发布

阅读量163

点赞数 1

分类专栏： tensorflow1

本文链接：https://blog.csdn.net/fanjianhai/article/details/103007289

版权

tensorflow1 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1. 变量

变量也是一种OP，是一种特殊的张量，能够进行存储持久化，它的值就是张量

1.1. 变量的创建

tensorflow1.15

import tensorflow as tf


a = tf.constant([1,2,3,4,5])
var = tf.Variable(tf.random_normal([2,3], mean=0.0, stddev=1.0))
# 做一步显示的初始化
init_op = tf.global_variables_initializer()

with tf.Session() as sess:
    # 必须运行初始化op
    sess.run(init_op)
    print(sess.run([a, var]))

tensorflow2.0貌似发生了变化

1.2. 可视化学习Tensorboard

数据序列化-events文件
- TensorBoard 通过读取 TensorFlow 的事件文件来运行
tf.summary.FileWriter(’/tmp/tensorflow/summary/test/’,graph=default_graph)
- 返回filewriter,写入事件文件到指定目录(最好用绝对路径)，以提供给tensorboard使用
开启
- tensorboard --logdir=/tmp/tensorflow/summary/test/
注：修改程序后，再保存一遍会有新的事件文件，打开默认为最新

代码实现

tensorflow1.15

import tensorflow as tf


a = tf.constant(3.0, name="a")
b = tf.constant(4.0, name="b")
c = tf.add(a, b, name="add")

var = tf.Variable(tf.random_normal([2,3], mean=0.0, stddev=1.0), name="var")
# 做一步显示的初始化
init_op = tf.global_variables_initializer()

with tf.Session() as sess:
    # 必须运行初始化op
    sess.run(init_op)
    
    # 程序的图结构写入事件文件, graph: 把指定的图写进事件文件
    file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
    print(sess.run([c, var]))

tensorboard截图

2. tensorflow实现一个简单的线性回归案例

import tensorflow as tf


# 自实现一个线性回归预测
# 1. 准备数据， x特征值[100, 1] y 目标值【100】
x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
# 假设的真实值 矩阵相乘必须是二维的
y_true = tf.matmul(x, [[0.7]]) + 0.8


# 2.建立线性回归模型， 一个特征，一个权重， 一个偏置y = x w + b
# 随机给一个权重和偏置的值，让他计算损失，然后在当前状态下优化
weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
bias = tf.Variable(0.0, name="b")

y_predict = tf.matmul(x, weight) + bias


# 3. 建立损失函数，均方误差
loss = tf.reduce_mean(tf.square(y_true-y_predict))


# 4. 梯度下降优化损失 learning_rate: 0~1 学习率不能够太大
train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)


# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()


with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为：%f,偏置为：%f' % (weight.eval(), bias.eval()))
    
    # 循环训练，运行优化
    for i in range(500):
        sess.run(train_op)
        print('第%d步参数权重为：%f,偏置为：%f' % (i, weight.eval(), bias.eval()))

3. 关于梯度爆炸、梯度消失

在极端的情况下，权重的值变得非常大，以至于溢出，导致NAN值
如何解决梯度爆炸？（深度神经网络如RNN当中更容易出现）
- 重新设计神经网络
- 调整学习率
- 使用梯度截断（在训练过程中检查和限制梯度的大小）
- 使用激活函数

4. tensorflow变量作用域

让模型代码更加清晰，作用分明
代码实现

import tensorflow as tf

with tf.variable_scope('data'):
    # 自实现一个线性回归预测
    # 1. 准备数据， x特征值[100, 1] y 目标值【100】
    x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
    # 假设的真实值 矩阵相乘必须是二维的
    y_true = tf.matmul(x, [[0.7]]) + 0.8

with tf.variable_scope('model'):
    # 2.建立线性回归模型， 一个特征，一个权重， 一个偏置y = x w + b
    # 随机给一个权重和偏置的值，让他计算损失，然后在当前状态下优化
    weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
    bias = tf.Variable(0.0, name="b")

    y_predict = tf.matmul(x, weight) + bias

with tf.variable_scope('loss'):
    # 3. 建立损失函数，均方误差
    loss = tf.reduce_mean(tf.square(y_true-y_predict))

with tf.variable_scope('optimizer'):
    # 4. 梯度下降优化损失 learning_rate: 0~1
    train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)


# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()

with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    # 将程序的图结构写入事件文件, graph: 把指定的图写进事件文件
    file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
    
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为：%f,偏置为：%f' % (weight.eval(), bias.eval()))
    
    # 循环训练，运行优化
    for i in range(500):
        sess.run(train_op)
        print('第%d步参数权重为：%f,偏置为：%f' % (i, weight.eval(), bias.eval()))

tensorboard截图

5. 增加损失值等变量显示

目的：观察模型的参数、损失值等变量的变化
收集变量
- tf.summary.scalar(name=’’,tensor) 收集对于损失函数和准确率
- 等单值变量,name为变量的名字，tensor为值
- tf.summary.histogram(name=‘’,tensor) 收集高维度的变量参数
- tf.summary.image(name=‘’,tensor) 收集输入的图片张量能显示图片
合并变量写入事件文件
- merged = tf.summary.merge_all()
- 运行合并：summary = sess.run(merged)，每次迭代都需运行
- 添加：FileWriter.add_summary(summary,i),i表示第几次的值
代码实现

import tensorflow as tf

with tf.variable_scope('data'):
    # 自实现一个线性回归预测
    # 1. 准备数据， x特征值[100, 1] y 目标值【100】
    x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
    # 假设的真实值 矩阵相乘必须是二维的
    y_true = tf.matmul(x, [[0.7]]) + 0.8

with tf.variable_scope('model'):
    # 2.建立线性回归模型， 一个特征，一个权重， 一个偏置y = x w + b
    # 随机给一个权重和偏置的值，让他计算损失，然后在当前状态下优化
    weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
    bias = tf.Variable(0.0, name="b")

    y_predict = tf.matmul(x, weight) + bias

with tf.variable_scope('loss'):
    # 3. 建立损失函数，均方误差
    loss = tf.reduce_mean(tf.square(y_true-y_predict))

with tf.variable_scope('optimizer'):
    # 4. 梯度下降优化损失 learning_rate: 0~1
    train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)

# 收集tensor
tf.summary.scalar("losses", loss)
tf.summary.histogram("weights", weight)

# 定义合并tensor的op
merged = tf.summary.merge_all()

# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()

with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    
    # 将程序的图结构写入事件文件, graph: 把指定的图写进事件文件
    file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
    
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为：%f,偏置为：%f' % (weight.eval(), bias.eval()))
    
    # 循环训练，运行优化
    for i in range(500):
        sess.run(train_op)
        
        # 运行合并的tensor
        summary = sess.run(merged)
        file_writer.add_summary(summary,i)
        
        print('第%d步参数权重为：%f,偏置为：%f' % (i, weight.eval(), bias.eval()))

tensorboard截图

6. 模型的保存与加载

f.train.Saver(var_list=None,max_to_keep=5)
- var_list:指定将要保存和还原的变量。它可以作为一个dict或一个列表传递.
- max_to_keep：指示要保留的最近检查点文件的最大数量。创建新文件时，会删除较旧的文件。如果无或0，则保留所有检查点文件。默认为5（即保留最新的5个检查点文件。）
例如：
- saver.save(sess, ‘/tmp/ckpt/test/model’)
- saver.restore(sess, ‘/tmp/ckpt/test/model’)
- 保存文件格式：checkpoint文件
代码实现

import tensorflow as tf
import os

with tf.variable_scope('data'):
    # 自实现一个线性回归预测
    # 1. 准备数据， x特征值[100, 1] y 目标值【100】
    x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
    # 假设的真实值 矩阵相乘必须是二维的
    y_true = tf.matmul(x, [[0.7]]) + 0.8

with tf.variable_scope('model'):
    # 2.建立线性回归模型， 一个特征，一个权重， 一个偏置y = x w + b
    # 随机给一个权重和偏置的值，让他计算损失，然后在当前状态下优化
    weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
    bias = tf.Variable(0.0, name="b")

    y_predict = tf.matmul(x, weight) + bias

with tf.variable_scope('loss'):
    # 3. 建立损失函数，均方误差
    loss = tf.reduce_mean(tf.square(y_true-y_predict))

with tf.variable_scope('optimizer'):
    # 4. 梯度下降优化损失 learning_rate: 0~1
    train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)

# 收集tensor
tf.summary.scalar("losses", loss)
tf.summary.histogram("weights", weight)

# 定义合并tensor的op
merged = tf.summary.merge_all()

# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()

# 定义一个保存模型的实例
saver = tf.train.Saver()

with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    
    # 将程序的图结构写入事件文件, graph: 把指定的图写进事件文件
    file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
    
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为：%f,偏置为：%f' % (weight.eval(), bias.eval()))

    # 加载模型， 覆盖模型当中随机定义的参数， 从上次训练的参数结果
    # 检测其中的一个文件checkpoint是否存在
    if os.path.exists("./tmp/ckpt/checkpoint"):
        saver.restore(sess, "./tmp/ckpt/model")
    
    # 循环训练，运行优化
    for i in range(500):
        sess.run(train_op)
        
        # 运行合并的tensor
        summary = sess.run(merged)
        file_writer.add_summary(summary,i)
        
        print('第%d步参数权重为：%f,偏置为：%f' % (i, weight.eval(), bias.eval()))
        
        if i % 100 == 0:
            # 保存模型, model为模型的名字
            saver.save(sess, "./tmp/ckpt/model")

7. 自定义命令行参数

7.1. tf.app.flags,它支持应用从命令行接受参数，可以用来指定集群配置等。在tf.app.flags下面有各种定义参数的类型

DEFINE_string(flag_name, default_value, docstring)
DEFINE_integer(flag_name, default_value, docstring)
DEFINE_boolean(flag_name, default_value, docstring)
DEFINE_float(flag_name, default_value, docstring)

7.2. tf.app.flags.,在flags有一个FLAGS标志，它在程序中可以调用到我们前面具体定义的flag_name

7.3. 通过tf.app.run()启动main(argv)函数

7.4. 代码实现

import tensorflow as tf
import os

# 定义命令行参数
# 1. 首先定义有哪些参数需要在运行时候指定
# 2. 程序当中获取定义命令行定义的参数
#  第一个参数：名字，默认值， 说明
tf.app.flags.DEFINE_integer("max_step",100, "模型训练的步数")
tf.app.flags.DEFINE_string("model_dir"," ", "模型的加载路径")
# 定义获取命令行参数名字
FLAGS = tf.app.flags.FLAGS

with tf.variable_scope('data'):
    # 自实现一个线性回归预测
    # 1. 准备数据， x特征值[100, 1] y 目标值【100】
    x = tf.random_normal(shape=[100, 1], mean=1.75, stddev=0.5, name="x_data")
    # 假设的真实值 矩阵相乘必须是二维的
    y_true = tf.matmul(x, [[0.7]]) + 0.8

with tf.variable_scope('model'):
    # 2.建立线性回归模型， 一个特征，一个权重， 一个偏置y = x w + b
    # 随机给一个权重和偏置的值，让他计算损失，然后在当前状态下优化
    weight = tf.Variable(tf.random_normal([1,1], mean=0.0, stddev=1.0), name="w")
    bias = tf.Variable(0.0, name="b")

    y_predict = tf.matmul(x, weight) + bias

with tf.variable_scope('loss'):
    # 3. 建立损失函数，均方误差
    loss = tf.reduce_mean(tf.square(y_true-y_predict))

with tf.variable_scope('optimizer'):
    # 4. 梯度下降优化损失 learning_rate: 0~1
    train_op = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(loss)

# 收集tensor
tf.summary.scalar("losses", loss)
tf.summary.histogram("weights", weight)

# 定义合并tensor的op
merged = tf.summary.merge_all()

# 定义一个初始化变量的op
init_op = tf.global_variables_initializer()

# 定义一个保存模型的实例
saver = tf.train.Saver()

with tf.Session() as sess:
    # 初始化变量
    sess.run(init_op)
    
    # 将程序的图结构写入事件文件, graph: 把指定的图写进事件文件
    file_writer = tf.summary.FileWriter("./tmp/summary/test/", graph=sess.graph)
    
    # 打印随机初始化的权重和偏置
    print('随机初始化的参数权重为：%f,偏置为：%f' % (weight.eval(), bias.eval()))

    # 加载模型， 覆盖模型当中随机定义的参数， 从上次训练的参数结果
    # 检测其中的一个文件checkpoint是否存在
    if os.path.exists("./tmp/ckpt/checkpoint"):
        saver.restore(sess, FLAGS.model_dir)
    
    # 循环训练，运行优化
    for i in range(FLAGS.max_step):
        sess.run(train_op)
        
        # 运行合并的tensor
        summary = sess.run(merged)
        file_writer.add_summary(summary,i)
        
        print('第%d步参数权重为：%f,偏置为：%f' % (i, weight.eval(), bias.eval()))
        
        if i % 100 == 0:
            # 保存模型, model为模型的名字
            saver.save(sess, FLAGS.model_dir)