numpy广播机制加速距离矩阵计算(numpy永远的神!)
由于楼主最近在打比赛,要对目标检测后的结果做分类,下游的分类任务需要与类别标签库中的图片做相似度计算,需要求距离矩阵,目标检测框出的图像特征reshape后是一个479432048的矩阵,总共有近1亿个元素,带查询库中的图像特征是310692048的矩阵,要求这两个超级大矩阵的距离矩阵。
首先想到的最朴素的思想就是for循环;尝试了之后发现需要耗费1200秒时间,但是比赛限制了inference时间要在30min以内,于是我想要加速
经过查询后得知,numpy的广播机制对于矩阵运算的效率提升十分明显,于
原创
2021-06-21 15:06:19 ·
683 阅读 ·
0 评论