神经网络从算法训练到FPGA部署 (1)--开发流程说明

最新推荐文章于 2024-01-26 09:58:31 发布

拾贝壳的大男孩

最新推荐文章于 2024-01-26 09:58:31 发布

阅读量7.3k

点赞数 5

分类专栏：新技能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38712697/article/details/100048956

版权

新技能专栏收录该内容

16 篇文章 2 订阅

订阅专栏

将深度神经网络算法部署到现实场景（基于FPGA），主要包含两部分的工作，一个是为场景找到合适的算法，训练出满足要求的模型；第2个是将模型定点化后部署在FPGA上运行，主要含以下步骤：

准备工作：数据收集及TFrecord制作，数据预处理函数编写。

练习时从kaggle网站上获取带标注数据集；

制作训练与验证用的Tfrecord数据文件；

图像增强、剪裁、pad、标准化等预处理；

训练及验证用的mini-batch数据生成（随机、多线程）

2. 基于Tensorflow框架下VGG13，InceptionV3，Resnet50网络改写及适配，适配到本地数据集的类别数。在本地数据集上训练，精度达到要求。

3. 网络模型压缩

Xilinx公司提供了Decent_Q工具进行模型压缩及定点，但官方只提供定点功能，带剪枝功能的模型压缩工具估计要另外收费。后面个人想自己开发一个工具替代该功能。通过网络结构及参数，将权重较小的或者值比较相近的kernel去掉，重新构建更稀疏的网络，保存新的网络和权重，重新导入数据，做微调重新训练，生成新的Pb，给xilinx的decent_Q做定点。

4. FPGA上的部署：

固化后的模型及参数保存，使用pb文件格式；

FPGA上DPU集成；

利用DNNDK工具生成DPU的运行指令；

Petalinux系统制作及DPU后端C程序开发。

不过如果不是卷积网络，就无法利用xilinx的这套工具链。

自己开发部署工具链一般包含：

硬件：硬件加速器的开发，针对算法开发算子、调度单元、通信模块。

定点工具及编译器：模型定点化，以及网络模型、权重翻译成指令及权重数据。

Runtime：运行时配合的驱动以及数据预处理、后处理代码。

另外，mxnet、keras、pytorch这些开发框架下开发的模型，可以转化成pb格式，这样可以适配采用不同框架开发算法的人员。

拾贝壳的大男孩

关注

5
点赞
踩
48

收藏

觉得还不错? 一键收藏
4
评论
神经网络从算法训练到FPGA部署 (1)--开发流程说明

将深度神经网络算法部署到现实场景（基于FPGA），主要包含两部分的工作，一个是为场景找到合适的算法，训练出满足要求的模型；第2个是将模型定点化后部署在FPGA上运行，主要含以下步骤：准备工作：数据收集及TFrecord制作，数据预处理函数编写。练习时从kaggle网站上获取带标注数据集；制作训练与验证用的Tfrecord数据文件； ...
复制链接

扫一扫

专栏目录

拾贝壳的大男孩 CSDN认证博客专家 CSDN认证企业博客

码龄7年

28: 原创

14万+: 周排名

43万+: 总排名

7万+: 访问

: 等级

1145: 积分

75: 粉丝

59: 获赞

21: 评论

328: 收藏

私信

关注

热门文章

分类专栏

最新评论

modelsim仿真调用xilinx IP的一种方法
吉尔伯特拳打托马斯: 请问怎么通过脚本和ui建立工程啊
modelsim仿真调用xilinx IP的一种方法
ssp_loser: 大佬，有modesim 10.6b 的安装包没
Xilinx的Zynq系列，ARM和PL通过DMA通信时如何保证DDR数据的正确性。
若丑 |WTJ: 请问楼主，你这里举例的10个short无法对齐的问题通过malloc函数解决了吗
Xilinx的Zynq系列，ARM和PL通过DMA通信时如何保证DDR数据的正确性。
董程森: 您好,假如通过cache更新400个short(16bit),也就是800个bytes的话.按照算法800/32bytes(A9 core) =25 是对齐的.然后10个short(16bit),也就是20个bytes,按照算法20/32无法对齐,那么就需要在PS端地址malloc的时候,多malloc12byts,达到32bytes,这样的话就可以完美使用cache了.请问我这样的理解对吗?(最近在搞cache相关的应用,我发现如果cache不对齐(例如上文我只用了10个short)的话,将会导致每次相同输入,不同的输出.我目前考虑是cache没对齐的原因.目前正在测试.
神经网络从算法训练到FPGA部署 (1)--开发流程说明
d_e_s_t_i_n_y: 兄弟你这个问题解决没，能否加个QQ交流一下。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。