Andrew Ng Deep Learning Tutorial中Softmax分类器梯度求导过程

1 篇文章 0 订阅

Andrew Ng的deep learning tutorial 中 Softmax分类器求梯度的过程省略了,他直接给出

Δθ(k)J(θ)=i=1mx(i)((y(i)=k)exp(θ(k)Tx(i)Kj=1exp(θ(j)x(i)))(*)

但一眼无法看出结果,所以自己求了一下,几次算错。网上查的时候也有人很少有人推导或推错。折腾一下终于知道怎么推了。推导过程如下:
J(θ)=i=1mk=1K{y(i)=k}logexp(θ(k)x(i))Kj=1exp(θ(j)x(i))(1)

P(y(i)=k|x(i);θ)=exp(θ(k)x(i))Kj=1exp(θ(j)x(i))(2)

(2)(1)J(θ)=i=1mj=0K(y(i)=j)θ(j)x(i)logp=1Kexp(θ(p)Tx(i))

jI.j=k
J(θ)=i=1mθ(k)x(i)logp=1Kexp(θ(p)Tx(i))J(θ)θ(k)=i=1mx(i)(1P(y(i)=k|x(i);θ))(3)

II:jk使j=qJ(θ)=i=1mθ(q)x(i)logp=1Kexp(θ(p)Tx(i))
J(θ)θ(k)=i=1mx(i)(P(y(i)=k|x(i);θ))(4)
.
综合式(3)(4)可得出结果式(*) 。附上andrew ng softmax回归的链接 http://ufldl.stanford.edu/tutorial/supervised/SoftmaxRegression/

### 回答1: Deep learning深度学习的英文版PDF可以通过网络搜索或在线学术资源网站获取。许多学术出版商如Springer、IEEE Xplore等提供了深度学习相关的英文书籍和论文的电子版。此外,也可以通过在线图书商店如Amazon等购买纸质书籍,然后自行扫描为PDF格式。最好的方法是使用英文关键词进行搜索,如"deep learning PDF",以便找到各种相关的资源。总之,要获取Deep learning的英文PDF,只需利用互联网资源进行搜索,将找到各种适合自己需求的材料。 ### 回答2: Deep learning深度学习的英文版,是一种机器学习的方法,通过构建和模拟人类神经网络的结构和功能,来实现对数据的自动化处理和分析。 Deep learning的模型通常是由多个神经网络层(即深度)构成的。每个层都通过多个神经元相互连接,形成一个复杂的网络结构。这些神经网络层之间的连接权重会随着训练过程的进行进行调整,以逐渐提高模型的表现和准确度。 Deep learning在许多领域都有广泛的应用。在计算机视觉领域,它可以进行图像识别、目标检测和图像生成等任务。在自然语言处理领域,它可以用于文本分类、机器翻译和语义分析等任务。 Deep learning的优势在于它可以通过大量的数据和计算资源进行训练,并能够从数据学习并提取更高级别的特征和模式。与传统的机器学习方法相比,Deep learning能够更好地处理具有复杂结构和大量参数的问题,提高模型的泛化能力和预测准确度。 为了学习Deep learning,可以阅读一些经典的英文PDF教材或论文。这些资源包括《Deep Learning》一书,由Ian Goodfellow、Yoshua Bengio和Aaron Courville等人合著的《Deep Learning Tutorial》以及Yann LeCun等人于2015年发表的《Deep Learning》论文。通过阅读这些资源,可以了解到关于Deep learning的理论基础、模型架构和常用算法等知识。 最重要的是,深度学习是一门需要实践的科学,通过实际动手实验和项目实践,才能真正掌握和应用Deep learning。因此,建议通过阅读相关的英文资料,并进行实际的编程练习和项目实践,以加深对Deep learning的理解和应用能力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值