上篇文章提到的INDArray中的repeat重写,我项目中使用的是40*1*300的矩阵操作,本人亲测性能得到了150倍的提升。
现在给出个直观的算法概念和具体实现代码:
Nd4j的repeat实现算法如图:
本人重写后的实现算法如图:
下面是针对我的项目情况的代码实现, 我的实现只针对被repeat的维度长度为1的情况,如果大家需要对任意长度维度的repeat操作,需要做少许修该。
/*
This funciton only support repeat the dimension of which the length of it is one.
* */
static INDArray re