【Tensorflow】op的理解和自定义损失函数

最新推荐文章于 2024-05-05 12:20:35 发布

sdbhewfoqi

最新推荐文章于 2024-05-05 12:20:35 发布

阅读量3.2k

点赞数 1

分类专栏： Tensorflow & Pytorch

本文链接：https://blog.csdn.net/weixin_31866177/article/details/81709965

版权

Tensorflow & Pytorch 专栏收录该内容

41 篇文章 7 订阅

订阅专栏

tensorflow中的基本概念

本文是在阅读官方文档后的一些个人理解。

官方文档地址：https://www.tensorflow.org/versions/r0.12/get_started/basic_usage.html#basic-usage

关于tensor和op的理解

Nodes in the graph are called ops (short for operations).
An op takes zero or more Tensors, performs some computation, and produces zero or more Tensors.

类比：一个神经元有多个输入，一个或者多个输出。这里的OP可以看作神经元，tensor可以看作输入的数据。

In TensorFlow terminology, a Tensor is a typed multi-dimensional array.
For example, you can represent a mini-batch of images as a 4-D array of floating point numbers with dimensions [batch, height, width,channels].

tensor是一个数组，每个数组元素是多维的，其实就是一个矩阵。

TensorFlow程序的阶段

TensorFlow程序通常被组织成一个构建阶段和一个执行阶段。在构建阶段，op 的执行步骤被描述成一个图。在执行阶段，使用会话执行执行图中的op。

阶段一：如何构建图？

1.构建图从创建op开始。有些op的创建是不需要input的，比如Constant。这样的op被成为源op（source op）。
2.在python中op对象是由op构造器（ops constructors）创建的。op构造器创建一个op对象时可以传递一个源op作为待构造op对象的输入。
3.op对象被op构造器创建后是作为一个node加入到graph中的。TensorFlow Python 库有一个默认图 (default graph), op 构造器可以为其增加节点。这个默认图对许多程序来说已经足够用了。

总结：因为graph是由op对象组成的，所以构建图的过程其实就是创建op对象的过程，以及如果将这些个op对象连接起来（比如某个op对象作为另外某个op对象的输入）的过程。

阶段二：图构建好了，如何执行？

1.因为graph需要在session中启动。所以为了启动一个graph，第一步就是创建session对象。
2.sessoin对象创建的时候如果不制定graph，则使用默认图（default graph）。

对Variable的理解

变量用于维护图执行过程中的状态信息。

通常会将一个统计模型中的参数表示为一组变量。例如, 你可以将一个神经网络的权重作为一个tensor存储在某个变量中。在训练过程中, 通过重复运行训练图，更新这个 tensor。

对feeds和fetches的理解

可以为任意的op赋值或者从其中获取数据。

对于tensor、Constants、Variables三者的理解

tensor存储在Constants或者Variables。就像数据可以放在常量和变量中一样。放在变量中的数据是可以修改的，放在常量中的数据是不可以修改的。

常量op也算是op吧，只是比较简单而已。

原地址：https://www.cnblogs.com/tsiangleo/p/6145112.html

自定义损失函数

import tensorflow as tf
from numpy.random import RandomState
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

batch_size = 8

#两个输入节点。
x = tf.placeholder(tf.float32,shape=(None,2),name='x-input')
#一个输出节点。
y_ = tf.placeholder(tf.float32,shape=(None),name='y-input')

#定义了一个单层的神经网络前向传播过程，这里就是简单加权和。
w1 = tf.Variable(tf.random_normal([2,1],stddev=1,seed=1))
y = tf.matmul(x,w1)

#自定义损失函数
#定义预测多了和预测少了的成本。
loss_less = 10
loss_more = 1
#此处用到了tf.greater 和 tf.where 来实现选择操作，tf.greater 的输入是两个张量，此函数会比较这两个输入张量中每个元素的大小，并返回比较结果。
#当tf.greater的输入张量维度不一样时，TensorFlow会进行类似NumPy广播操作处理。
#tf.where函数有三个参数，第一个为选择条件根据，当为True时，tf.where函数选择第二个参数中的值，否则使用第三个参数中的值。
loss = tf.reduce_sum(tf.where(tf.greater(y,y_),(y - y_)*loss_more,(y_ - y)*loss_less))
train_step = tf.train.AdamOptimizer(0.001).minimize(loss)

#通过随机数生成一个模拟数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size,2)
#设置回归的正确值为两个输入的和加上一个随机变量。之所以要加上一个随机量是为了加入不可预测的噪音，
#否则不同损失函数的意义就不大了，因为不同损失函数都会在能完全预测正确的时候最低。一般来说噪音为一个均值为0的小量，
#所以这里的噪音设置为-0.05~0.05的随机数。
Y = [[x1 + x2 +rdm.rand()/10.0-0.05] for (x1,x2) in X]

#训练神经网络。
with tf.Session() as sess:
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    STEPS = 5000
    for i in range(STEPS):
        start = (i * batch_size) % dataset_size
        end = min(start+batch_size,dataset_size)
        sess.run(train_step,
                 feed_dict={x:X[start:end],y_:Y[start:end]})
    print (sess.run(w1))

'''
输出结果：
[[1.0193471]
 [1.0428091]]
'''

sdbhewfoqi

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
【Tensorflow】op的理解和自定义损失函数

tensorflow中的基本概念本文是在阅读官方文档后的一些个人理解。官方文档地址：https://www.tensorflow.org/versions/r0.12/get_started/basic_usage.html#basic-usage关于tensor和op的理解Nodes in the graph are called ops (short for operation...
复制链接

扫一扫