yolo简单易实现,对于嵌入式很友好。我实现的第一个dsp上全自动转化的框架就是给予yolov2。首先将作者给的cfg文件与weights文件通过脚本转化为caffe支持的prototxt与caffemodel。再通过generator对caffemodel进行权重的量化与重排序。这些工作都可以在PC端完成,而dsp端通过simd实现了3x3与1x1卷积的计算加速,运行效果很不错。我运行的是tiny-yolo网络,仅7gflops/3.5g macc.而现有的硬件一般1tops~2tops。能跑100多帧。感觉还是很有应用前景的。并且使用tiny-yolo网络针对特定的应用于数据集,都还能取得一个比较不错的效果。适合对准确率要求没有那么严苛的场景中。只不过作者经常更改darknet的代码。。导致dsp端的优化代码和darknet代码经常对不上。。或者权重的排列也会改变。。net.seen 从32bit变为64bit。。。真是一段悲伤的debug过程。。nms方式也换掉了。。输入图像的resize方式也换了。。只能说darknet太小众并且随意了。
未来应该回去继续支持yolov3,粗略看起来应该现在的layer都得到了支持。mobilenet+yolo+resent看起来就比较有前途。把权重搞到几mb。在一些工业检测、辅助驾驶、人脸检测、行人、车辆检测等场景下还是很有应用前景的