TensorFlow自定义损失函数

最新推荐文章于 2024-05-20 15:51:55 发布

修炼之路

最新推荐文章于 2024-05-20 15:51:55 发布

阅读量1.9w

点赞数 5

分类专栏： tensorflow修炼之路

本文链接：https://blog.csdn.net/sinat_29957455/article/details/78369763

版权

tensorflow修炼之路专栏收录该内容

47 篇文章 27 订阅

订阅专栏

TensorFlow提供了许多的损失函数，在训练模型中经常使用的损失函数有交叉熵、平方差。TensorFlow除了提供这些损失函数之外，还给开发者提供了一种自定义损失函数的方法。让开发者，可以根据实际项目的需要来自定义损失函数，让我们可以更好的训练出满足开发者需要的模型。

一、为什么要自定义损失函数

在某些开发场景下，系统提供的损失函数已经无法满足我们的要求。如，我们需要为一个奶茶店提供一个原料的进货模型，通过分析大量的会影响进货原料的供应量的数据来建立一个模型，比如说，某一种原料的成本价是1元，利润是5元，如果模型在预测所需要该种原料的进货量时，模型比实际少预测了一件，那么商家将会损失5元，如果模型比实际多预测了一件的时候，那么商家将会损失1元。很显然，我们应该选择第一种模型，以便为商家提供更大的利润。如果，我们使用平方差作为损失函数的时候，很有可能这个模型将会无法达到预期的最大化利润（即第一种情况）。为了保证商家的利润能够最大化，需要将损失函数与商家的利润联系起来，从而来保证商家利润的最大化。下面，将给出通过商家利润来构建的损失函数：

其中f(x,y)=a(x-y) x>y这个函数是针对，当预测的原料数量小于实际所需要的原料时的损失函数，如实际需要的原料的数量为10，而预测值为8，那么损失的利润是f(x,y) = 5 * (10 - 8)=10，f(x,y) = b(y - x) x<=y函数是针对，当预测的原料数量多于实际所需要的原料时的损失函数，如实际需要的原料数量还是为10，而预测值为12，那么损失的利润是f(x,y) = 1 * (12 - 10) = 2。通过这两个函数，我们就可以直接的将利润与损失函数联系起来了。

二、相关TensorFlow函数介绍

1、tf.greater(x,y,name=None)函数介绍

函数的主要功能是比较张量元素的大小，返回一个张量类型为'bool'，元素为True或者False

x：是一个张量（Tensor），这个张量必须是float32、float64、int32，int64、uint8、int16、int8、uint16、half类型。

y：是一个张量（Tensor），这个张量的类型必须和x一样。

name：操作的名称（可选）。

import tensorflow as tf

if __name__ == "__main__":
    #定义一个张量a
    a = tf.constant([1.,2.])
    #定义一个张量b
    b = tf.constant([3.,4.])
    #创建一个session并设置为默认session
    sess = tf.InteractiveSession()
    #比较a和b的大小，如果前一个大于后一个为True，否则为False
    print(tf.greater(a,b).eval())
    # [False False]
    print(tf.greater(b,a).eval())
    #[ True  True]

当，x张量和y张量的维度大小不一致的时候，TensorFlow会使用类似于numpy广播的形式处理两个张量

import tensorflow as tf

if __name__ == "__main__":
    #定义一个张量a
    a = tf.constant([1.,4.])
    #定义一个张量b
    b = tf.constant([3.])
    #创建一个session并设置为默认session
    sess = tf.InteractiveSession()
    #比较a和b的大小，如果前一个大于后一个为True，否则为False
    print(tf.greater(a,b).eval())#实际比较的时候，类似于将张量b扩展成了[3.,3.]之后，再与a进行比较
    # [False  True]
    print(tf.greater(b,a).eval())
    #[ True False]

2、tf.where(condition,x=None,y=None,name=None)
通过condition一个类型为bool的元素来选择张量x或者张量y中的元素，如果张量condition中bool类型的元素来判断是选择张量x中的元素还是选择张量y中的元素，如果为True则选择x中的元素，否则选择y中的元素。tf.select函数与tf.where函数拥有相同的功能，但在TensorFlow有一些版本中已经移除该函数。

condition：一个张量元素的类型为bool。

x：是一个张量与张量condition有同样的大小，如果condition是1阶的，x可以有更高阶，但是第一个维度的大小必须和conditio一致。

y：是一个与x有同样大小的张量

name：操作的名称（可选）。

import tensorflow as tf

if __name__ == "__main__":
    #定义一个张量a
    a = tf.constant([1.,2.,3.])
    #定义一个张量b
    b = tf.constant([4.,5.,6.])
    #创建一个session并设置为默认session
    sess = tf.InteractiveSession()
    print(tf.where([True,False,True],a,b).eval())
    # [ 1.  5.  3.]

当，condition是一阶的，而x和y拥有更高阶时

import tensorflow as tf

if __name__ == "__main__":
    #定义一个张量a
    a = tf.constant([[1.,2.,3.],[1,2,3]])
    #定义一个张量b
    b = tf.constant([[4.,5.,6.],[7,8,9]])
    #创建一个session并设置为默认session
    sess = tf.InteractiveSession()
    print(tf.where([True,False],a,b).eval())
    '''
    [[ 1.  2.  3.]
     [ 7.  8.  9.]]
    '''
    print(tf.where([[True, False,True],[True, False,True]], a, b).eval())
    '''
    [[ 1.  5.  3.]
     [ 1.  8.  3.]]
    '''

三、自定义损失函数训练模型

import tensorflow as tf
from numpy.random import RandomState

if __name__ == "__main__":
    #设置每次迭代时数据的大小
    batch_size = 8
    #定义输入和输出节点
    #定义输入节点，设置输入的数据为1行2两列，设置None的目的是表示不确定输入数据的个数
    #最后，我们会将整个的数据数据整合成一个矩阵
    x = tf.placeholder(tf.float32,shape=(None,2),name='x-input')
    #定义输出节点，保证每个输入值所对应的输出值为1维的
    y_ = tf.placeholder(tf.float32,shape=(None,1),name='y-input')
    #定义神经网络的前向传播过程
    #定义参数，设置参数的大小为两行一列
    w1 = tf.Variable(tf.random_normal([2,1],stddev=1,seed=1))
    #输入矩阵与参数进行加权和
    y = tf.matmul(x,w1)
    #定义预测多了和预测少了的损失的利润
    loss_less = 5
    loss_more = 1
    #定义损失函数
    loss = tf.reduce_sum(tf.where(tf.greater(y,y_),(y-y_)*loss_more,(y_-y)*loss_less))
    #最小化损失函数
    train_step = tf.train.AdamOptimizer(0.001).minimize(loss)
    #随机生成一个数据集
    rdm = RandomState(1)
    #设置数据集的大小
    dataset_size = 128
    #产生输入数据
    X = rdm.rand(dataset_size,2)
    #定义输出y
    '''
    设置样本的输出值为，两个输入值相加并加上一个随机量。
    还为输出值设置了一个-0.05~0.05的随机数噪音，达到模拟真实数据的效果。
    '''
    Y = [[x1+x2 + rdm.rand()/5.0 - 0.05] for (x1,x2) in X]
    #训练神经网络
    with tf.Session() as sess:
        #初始化参数变量
        init_op = tf.initialize_all_variables()
        sess.run(init_op)
        #设置迭代次数
        STEPS = 5000
        for i in range(STEPS):
            start = (i * batch_size) % dataset_size
            end = min(start + batch_size,dataset_size)
            #训练模型
            sess.run(train_step,feed_dict={x:X[start:end],y_:Y[start:end]})
        print(w1.eval())
        #[[ 1.08637631]
        # [ 1.12113917]]

通过上面自定义的损失函数可以发现，最后的输出结果的参数会略大于1，而我们在定义实际的输出结果是x1+x2+随机数，参数值应该都为1。因为，我们在使用损失函数的时候，指定了当预测少的损失更大，所以预测值会比实际值要大一些。如果，我们指定损失函数的时候，指定预测多的损失更大，那么所求得的参数值将会略小于1。通过自定义损失函数，来更好的满足我们实际的模型需要，从中可以发现，损失函数对一个模型的重要性。

修炼之路

关注

5
点赞
踩
38

收藏

觉得还不错? 一键收藏
打赏
1
评论
TensorFlow自定义损失函数

TensorFlow提供了许多的损失函数，在训练模型中经常使用的损失函数有交叉熵、平方差。TensorFlow除了提供这些损失函数之外，还给开发者提供了一种自定义损失函数的方法。让开发者，可以根据实际项目的需要来自定义损失函数，让我们可以更好的训练出满足开发者需要的模型。一、为什么要自定义损失函数在某些开发场景下，系统提供的损失函数已经无法满足我们的要求。如，我们需要为一个奶茶店提供一个原
复制链接

扫一扫