HPC
文章平均质量分 52
农夫山泉2号
关于交流可以发邮件:778961303@qq.com
展开
-
【CNN】——对硬件优化的AdderNet加法网络简读
code:https://github.com/huawei-noah/AdderNet来自:华为摘要:为了降低计算复杂度和能量负担,我们提出了一种新的使用加法器卷积神经网络(AdderNet)的极简硬件结构,其中原始的卷积只被加法器核替换。为了最大限度地挖掘潜在的能源消耗,我们探索了具有共享尺度因子方法的AdderNet的低位量化算法,并为AdderNet设计了特定的和通用的硬件加速器。结果表明,具有int8/int16量化的加法器核也表现出较高的性能,同时消耗较少的资源(理论上∼为81%)。此.原创 2022-01-19 20:59:04 · 1080 阅读 · 0 评论 -
【ppl】——推理引擎openppl
来自商汤的直播原创 2021-12-07 19:55:35 · 449 阅读 · 0 评论 -
【Tengine端侧推理框架】——注册机制(一)
code:https://github.com/OAID/Tengine图片,代码都来自以上项目。1. 简介Tengine 由 OPEN AI LAB 主导开发,该项目实现了深度学习神经网络模型在嵌入式设备上的快速、高效部署需求。为实现在众多 AIoT 应用中的跨平台部署,本项目使用 C 语言进行核心模块开发,针对嵌入式设备资源有限的特点进行了深度框架裁剪。同时采用了完全分离的前后端设计,有利于 CPU、GPU、NPU 等异构计算单元的快速移植和部署,降低评估、迁移成本。2. Content.原创 2021-06-25 19:35:55 · 559 阅读 · 2 评论 -
【CNN】——卷积优化二winograd
转载自:参考卷积神经网络中的Winograd快速卷积算法https://martin20150405.github.io/2019/11/13/dl-winograd-kuai-su-juan-ji-suan-fa/#toc-heading-38https://zhuanlan.zhihu.com/p/260109670原创 2021-06-24 17:35:05 · 287 阅读 · 2 评论