RV1126上运行yolov3及推理性能

这篇博客分享了如何从官方获取yolov3的C编译demo并进行rknn_yolo_demo的编译,重点介绍了在RV1126硬件平台上的推理性能测试,包括模型输入输出细节和运行时间。展示了1.2MHz CPU、700MHz NPU和924MHz DDR下的性能数据。
摘要由CSDN通过智能技术生成

yolov3的c编译demo可以找官方拿到,改下编译器路径。生成rknn_yolo_demo可执行程序

http://t.rock-chips.com/forum.php?mod=viewthread&tid=184&highlight=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD

可以在该论坛下拿到yolov3的模型转换脚本。

注意:要登陆才能查看和下载。

将rknn_yolo_demo和dog_416x416,yolov3_rknn.rknn,push或者通过Xftp到一个文件夹。

注意:除了/主文件夹,rv1126在断开电源或reboot之后其他文件夹的外来文件就会被删除

这是我测出的推理性能

model input num: 1, output num: 3
input tensors:
index=0 name=input_0 n_dims=4 dims=[1 3 416 416] n_elems=519168 size=519168 fmt=0 type=3 qnt_type=2 fl=0 zp=0 scale=0.003922
output tensors:
index=0 name=output_199 n_dims=4 dims=[1 255 13 13] n_elems=43095 size=43095 fmt=0 type=3 qnt_type=2 fl=-68 zp=188 scale=0.155023
index=1 name=output_225 n_dims=4 dims=[1 255 26 26] n_elems=172380 size=172380 fmt=0 type=3 qnt_type=2 fl=-64 zp=192 scale=0.156099
index=2 name=output_251 n_dims=4 dims=[1 255 52 52] n_elems=689520 size=689520 fmt=0 type=3 qnt_type=2 fl=-72 zp=184 scale=0.233074
111111111111111111
rknn_run
rknn_run ==>  143.595000 ms
rknn_outputs_get ==> 22.931000 ms
rknn_run + rknn_outputs_get + rknn_outputs_release ==> 283.247600 ms

注意:我的RV1126的CPU——1.2MHz,NPU——700MHz,DDR——924MHz

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值