keras的binary_crossentropy的一个细节

二进制交叉熵是交叉熵的一种特殊情况,专门处理二分类问题。

二进制交叉熵公式:

假定样本预测值f(x)=a,当样本标签y=1,L=lnf(x),当y=0,L=ln(1-f(x))。

Keras.losses.binary_crossentropy实现源码如下:

主要注意的地方有以下几处:

(1)keras自带的binary_crossentropy()函数对最后一个维度(last axis)求解mean。

(2)后端tf函数binary_crossentropy()对预测值做了截断clip处理,限制取值在[epsilon, 1-epsilon]。

(3)函数的输入y_true和y_pred是categorical编码(非categorical其实也可以)。

(4)这里的a(也就是f(x))是sigmoid函数的输出。

第2点好理解,但第1点让人有点费解。

其实原因在于:当target和ouput是categorical编码时,-(target*log(output) + (1-target)*log(1-output))实际上对正样本标签y=1数据重复计算了一次。

理解如下:

假定:y_true [0,1], y_pred [0.2, 0.8]

那么: -0.5([0,1]×log([0.2, 0.8]) + [1,0]×log([0.8, 0.2])),样本误差被计算2次,存放最后一个维度中,因此tf计算后返回给keras时需要对最后一个维度做mean处理。

更多学习笔记可以关注我的微信公众号「kelly学技术」,欢迎交流。

-- over --

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值