Theano学习笔记（四）——导数

最新推荐文章于 2019-06-18 16:14:15 发布

ycheng_sjtu

最新推荐文章于 2019-06-18 16:14:15 发布

阅读量1w

点赞数 1

分类专栏： Python 文章标签：深度学习 python Theano 导数 Deep Learning

本文链接：https://blog.csdn.net/ycheng_sjtu/article/details/38929057

版权

本文介绍如何在Theano中计算导数，包括使用T.grad计算标量导数，逻辑函数sigmoid的导数，以及雅克比矩阵和海森矩阵的计算方法。通过扫描操作和符号循环提升效率，探讨了雅克比矩阵的左右乘以及海森矩阵乘以向量的应用。

摘要由CSDN通过智能技术生成

导数使用T.grad计算。

这里使用pp()打印梯度的符号表达式。

第3行输出是打印了经过优化器简化的符号梯度表达式，与第1个输出相比确实简单多了。

fill((x** TensorConstant{2}), TensorConstant{1.0})指创建一个x**2大小的矩阵，并填充1。

importtheano.tensor as T
fromtheano import pp
fromtheano import function
x= T.dscalar('x')
y= x ** 2
gy= T.grad(y, x)
printpp(gy)
f= function([x], gy)
printf(4)
printpp(f.maker.fgraph.outputs[0])
>>> 
((fill((x** TensorConstant{2}), TensorConstant{1.0}) * TensorConstant{2}) * (x **(TensorConstant{2} - TensorConstant{1})))
8.0
(TensorConstant{2.0}* x)

T.grad的第1个参数必须是标量

例如计算逻辑函数sigmoid的导数：

$\frac{{ds\left( x \right)}}{{dx}} = s\left( x \right) \cdot \left( {1 - s\left( x \right)} \right)$

importtheano.tensor as T
fromtheano import function
x= T.dmatrix('x')
s= T.sum(1 / (1 + T.exp(-x)))
gs= T.grad(s, x)
dlogistic= function([x], gs)
printdlogistic([[0, 1], [-1, -2]])
>>> 
[[0.25        0.19661193]
 [ 0.19661193 0.10499359]]