【机器学习】Softmax推导

LR可以看成是Softmax的特例。 LR主要是用于二分类,如果面临的是多分类问题,可以用Softmax。Softmax通常也是深度学习图像识别网络的最后一层。

在LR中,参数 θ 是一个向量,而在Softmax中,参数可以看成是一个矩阵。也就是每一个输出都对应着一个参数向量:

hθ(xi)=p(yi=1|xi;θ)p(yi=2|xi;θ)p(yi=k|xi;θ)=1kj=1eθTjxieθT1xieθT2xieθTkxi

其中 k 是类别数。这里 xiyi 的下标表示第i个数据。 θk 的下标表示第k类对应的参数向量。
这样,与LR类似,将上式写在一起

p(yi|xi;θ)=j=1keθTjxikj=1eθTjxiI(yi=j)

I 是[0,1]的判别函数。

概率形式有了就可以写出最大似然:

L(θ)=i=1mp(yi|xi;θ)

取对数:

l(θ)=lnL(θ)=lni=1mp(yi|xi;θ)=lni=1mj=1keθTjxikj=1eθTjxiI(yi=j)=i=1mj=1kI(yi=j)lneθTjxikj=1eθTjxi=i=1mj=1kI(yi=j)lneθTjxilnj=1keθTjxi

θj 的第 p 个分量 θpj 求导数:

l(θ)θpj=i=1mI(yi=j)xpieθTjxikj=1eθTjxixpi=i=1mxpi[I(yi=j)p(yi=j|xi;θ)]

之后用梯度下降法就可以了。推导的关键之处就是写出概率表示 p(yi|xi;θ)

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值