NCNN的winograd卷积使用条件是:
- kernel为3x3,stride为1x1,kernel的扩展系数为1x1
- 输入和输出的channel个数大于等于32,小于等于128
- bottom_blob padding后的blob 的width和height小于等于120
Winograd的卷积实现主要有如下几个步骤:
- 把kernel data进行扩充为8x8,并重新排列;
- 把bottom blob数据进行重新排列
- 进行winograd 操作;
- 把输出数据重新排列,存入top blob中。
winograd 实现稍微复杂了些,下一步,我还是先从非neon的实现深入分析吧,请关注后续的更新。