给tensor进行切片赋值是使用tensorflow开发模型的常用操作,具体方法如下:
#定义一个5*2*3的变量
a=tf.Variable(tf.zeros((5,2,3)),name='myTensor')
#对中间维度为1的切片进行赋值
a[:,1,:].assign(tf.constant([[1,2,3],[4,5,6],[7,8,9],[10,11,12],[13,14,15]],dtype=tf.float32))
#赋值后的a
<tf.Variable 'myTensor:0' shape=(5, 2, 3) dtype=float32, numpy=
array([[[ 0., 0., 0.],
[ 1., 2., 3.]],
[[ 0., 0., 0.],
[ 4., 5., 6.]],
[[ 0., 0., 0.],
[ 7., 8., 9.]],
[[ 0., 0., 0.],
[10., 11., 12.]],
[[ 0., 0., 0.],
[13., 14., 15.]]], dtype=float32)>
关于训练:考虑一个更复杂的赋值例子,a是一个可以训练的变量,我们把a作为切片赋值为变量b,函数f(b)是否也可以对a求导呢?通过实验看一下吧。
#a是可以求导的变量
a=tf.Variable([5.0,4.0],trainable=True,name='a')
#b是可以求导的变量
b=tf.Variable(tf.zeros((3,2)),trainable=True,name='b')
#将a赋值给b的第一行
b[0,:].assign(a)
#fun=b1*b1+...+bn*bn
with tf.GradientTape() as tape:
fun=tf.reduce_sum(b*b)
grad=tape.gradient(fun,b)
#求导结果
grad
<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[10., 8.],
[ 0., 0.],
[ 0., 0.]], dtype=float32)>
对b求导的结果符合预期,那对a求导呢?
with tf.GradientTape() as tape:
fun=tf.reduce_sum(b*b)
grad=tape.gradient(fun,a)
grad
对a求导结果为空,说明导数不存在。说明切片赋值仅仅是将a的值赋给了b,b中并不包含变量a,fun仅仅是b的函数!
注:tensorflow版本 2.2
每天学习一个小技巧~~