-tf.reduce_sum(one_hot_labels * log_probs, axis=-1)是什么损失函数？

江南蜡笔小新

于 2022-09-15 17:01:57 发布

阅读量756

点赞数

分类专栏： Note 杂记文章标签： python 深度学习人工智能

本文链接：https://blog.csdn.net/ftimes/article/details/126875105

版权

Note 同时被 2 个专栏收录

59 篇文章 1 订阅

订阅专栏

杂记

43 篇文章 1 订阅

订阅专栏

    log_probs = tf.nn.log_softmax(logits, axis=-1)
    one_hot_labels = tf.one_hot(labels, depth=num_labels, dtype=tf.float32)
    per_example_loss = -tf.reduce_sum(one_hot_labels * log_probs, axis=-1)
    loss = tf.reduce_mean(per_example_loss)

由于BERT代码当初是用Tensorflow1.x发布的，阅读代码时没太看懂这个loss function，经查证，是：
负对数似然(negative log-likelihood)

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

江南蜡笔小新

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
-tf.reduce_sum(one_hot_labels * log_probs, axis=-1)是什么损失函数？

-tf.reduce_sum(one_hot_labels * log_probs, axis=-1)是什么损失函数？由于BERT代码当初是用Tensorflow1.x发布的，阅读代码时没太看懂这个loss function
复制链接

扫一扫