day2:深度学习加速器

定制AI加速器设计

Vits AI Optimizer
剪枝、量化、定点化
XIR AI编译器
输入模型–翻译为XIR指令集–编译–执行
DPU
片上互联网、传感器接口
versal:各种API接口
IP核、工具链

DAC-SDC 2020冠军队伍分享

异构计算:
数据结构、操作系统、计算机体系结构
FPGA体系结构
软硬件协同设计
HLS高层次综合

ultra96
VGG
FPS:280
精度(IOU):0.731
功耗:4.2W
参数量:0.21M
计算量:184M
int4

自顶向下:模型构建、模型压缩
自底向下:模型构建、模型搜索

设计思路:
减少外储访问、提高并行度
模型压缩、低比特量化、放在片上

在这里插入图片描述
在这里插入图片描述
滑动窗口
line buffer

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
多核、负载均衡减少读图时间

HBM性能优化

memory typs: DDR3\DDR4\HBM

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值