【论文阅读】A High-Performance CNN Processor Based on FPGA for MobileNets
CNN由于参数量巨大难以部署到嵌入式设备上。背景研究的问题两个专用计算引擎: ConV Dwcv , 专用点卷积 和 深度卷积, 显著提高加速器效率。2、设计了一个特殊架构:Channel Augmentation , 提高MobileNets的第一层。3、本文设计的加速器可以灵活部署在不同配置的设备上,可以平衡硬件资源和计算性能。4、我们的加速器运行在ZU2 \ ZU9 MPSoC FPGA5、分类性能 ImageNet 205.3 fps @ ZU2 , 809.8 fps@ZU9。
原创
2024-01-12 13:01:53 ·
1093 阅读 ·
4 评论