在做cs231n的assignment3作业时,发现了作业提示中用np.add.at做word embedding 反向传播。我在网上找了很多资料,大概了解了np.add.at的作用方式。这里将我的理解记录下来,希望能对他人有所帮助,也欢迎大家批评指正。
1.关于index(索引)的解释
首先必须区分开来的概念是,以tuple(元组),list(列表)作为索引是两种不同的索引方式,会导致不同的结果。这一点在官方文档里Indexing有详细解释。
>>> y = np.arange(35).reshape(5,7)
>>> y
array([[ 0, 1, 2, 3, 4, 5, 6],
[ 7, 8, 9, 10, 11, 12, 13],
[14, 15, 16, 17, 18, 19, 20],
[21, 22, 23, 24, 25, 26, 27],
[28, 29, 30, 31, 32, 33, 34]])
>>> y[(1,2),(2,3)]
array([ 9, 17])
#以tuple作为作为索引时,每个tuples作为坐标,所以这里返回两个元素,第一个元素为y[1][2]=9,第二个元素为y[2][3]=17
>>> y[[1,2,0],[3,4,2]]
array([10, 18, 2])
#以list作为索引时,以第一个list作为第一个维度的指标,第二个list作为第二个维度的指标,所以这里的结果为y[1][3],y[2][4],y[0][2]
>>> y[[1,2,0]]
array([[ 7, 8, 9, 10, 11, 12, 13],
[14, 15, 16, 17, 18, 19, 20],
[ 0, 1, 2, 3, 4, 5, 6]])
#当只有一个list时,则索引第一个维度,其它维度全选,所以这里的结果为y[1],y[2],y[0]
2.以arrays作为索引
以array类型作为索引时,结果的shape与作为索引的array的shape是相同的,而其中的值为对应的索引值。
还是看例子比较容易理解:
>>> y
array([[ 0, 1, 2, 3, 4, 5, 6],
[ 7, 8, 9, 10, 11, 12, 13],
[14, 15, 16, 17, 18, 19, 20],
[21, 22, 23, 24, 25, 26, 27],
[28, 29, 30, 31, 32, 33, 34]])
>>> y.shape
(5, 7)
>>> e=np.array([