SOPHON SDK模型转换的常见问题

算能开发者社区

已于 2022-08-18 10:44:01 修改

阅读量450

点赞数

分类专栏： SOPHON SDK常见问题文章标签：人工智能

于 2022-08-11 10:05:04 首次发布

本文链接：https://blog.csdn.net/lily_19861986/article/details/126279616

版权

SOPHON SDK常见问题专栏收录该内容

29 篇文章 10 订阅

订阅专栏

SOPHON SDK模型转换的常见问题

1. 模型转换失败怎么办
2. 如何使用BMLang开发自定义的算子
3. 是否支持模型的在线编译
4. fp32模型的输出和原始模型输出差异比较大怎么办
5. YOLOv3的darknet模型先转为caffe模型后再转为fp32bmodel，模型输出和原始模型输出存在偏差？
6. 使用bmnetd编译Darknet出现段错误Unknown error 27620053？

1. 模型转换失败怎么办

检查命令行输入参数有没有错误，这个一般会有打印提示；
不支持的算子需要使用BMLang或者OKKernel开发，也可以联系FAE来解决；
如果是pytorch模型，是不是没有做trace？
使用转换工具编译模型时，设置环境变量export BMCOMPILER_STAT_ERR=1，然后加上–v 4，保存更详细的日志，提供给我方技术人员进一步排查；
有时转换失败是因为误差比对超过了允许的阈值而导致编译过程中断，目前比对误差阈值设置为误差在0.01之内，但也不排除有些模型有很多的累加或除法操作，由于尾差累计导致超出这个范围；可以加上–cmp False关闭比对，最终到业务层面上验证转换后的模型精度是否符合要求；
2.7.0以后的sdk可以通过BMCOMPILER_STAT_ERR=1，来看每层的数据相似度，个别超过误差不会中断完整编译过程。

2. 如何使用BMLang开发自定义的算子

BMLang是算能科技面向用户推出的针对BM168x TPU的一套高级编程接口库，使得用户可以快速的基于TPU硬件开发自定义算子，甚至整个神经网络。

BMLang的基本元素是：张量数据（bmlang::Tensor）和计算操作（bmlang::Operator）。用户需要使用bmlang::Tensor和bmlang::Operation来编写C++代码，然后在程序最后使用bmlang::compile或bmlang::compile_with_check来生成TPU可以运行的二进制文件BModel，与普通网络编译产生的BModel文件一样，依赖于BMRuntime接口载入与执行。

3. 是否支持模型的在线编译

不支持，模型编译的过程特别耗时。因此采用了离线编译生成BModel，在线推理时直接加载BModel运行的方式。

4. fp32模型的输出和原始模型输出差异比较大怎么办

对于两个模型采用同样的输入，看看输出是否一致，比如输入都是用全部是0.1的矩阵，填充input tensor的内存空间，然后做推理，比较输出数据的差异;
设置 export BMRT_SAVE_IO_TENSORS=1，运行bmruntime的时候会输出两个文件 input_ref_data.dat.bmrt和output_ref_data.dat.bmrt，用这个和理想的输入输出作对比排查；比较数据时尽量使用二进制比较，不要通过打印的数据比较，因为打印的输入格式不一样，也会导致数据显示不一样。