MobileNet、ShuffleNet 在理论上速度很快,工程上并没有特别大的提升.
为什么GPU上表现乏力的GPU,到CPU上反而一骑绝尘了呢?
深度可分离卷积的总计算量变小了,但深度可分离卷积的层数变多了。
若GPU的显存足够大,因为每层的计算都可以并行一次处理,则此时总运算时间的主导因素是网络的层数。
MobileNet、ShuffleNet 在理论上速度很快,工程上并没有特别大的提升.
为什么GPU上表现乏力的GPU,到CPU上反而一骑绝尘了呢?
深度可分离卷积的总计算量变小了,但深度可分离卷积的层数变多了。
若GPU的显存足够大,因为每层的计算都可以并行一次处理,则此时总运算时间的主导因素是网络的层数。