假定我们有下面下面4个参数w1,w2,b1,b2以及对应的cost。我看到早些版本的求导是这么写的
params1 = [w1,b1]
params2 = [w2,b2]
params = params1.extend(params2)
gparams = [(T.grad(cost, param) for param in params)]
还有一种是
gparams = T.grad(cost, params)
我个人觉得是没有区别
假定我们有下面下面4个参数w1,w2,b1,b2以及对应的cost。我看到早些版本的求导是这么写的
params1 = [w1,b1]
params2 = [w2,b2]
params = params1.extend(params2)
gparams = [(T.grad(cost, param) for param in params)]
还有一种是
gparams = T.grad(cost, params)
我个人觉得是没有区别