pytorch版本导出onnx的代码大致雷同,op12,定义input,outname,唯一注意的是最后一层argmax不要onnx导出。这个op用onnx导出直接导致推理结果全为0.
如果还有提示pad的错误,可以直接修改inputsize为7的整数倍,去掉pad部分的代码。
tensorrt版本本次选用8.2.3,不需要自定义plugin,layernorm ,gelu都能正确解析推理。
argmax的后处理直接用c++重写,适用于分割。
pytorch版本导出onnx的代码大致雷同,op12,定义input,outname,唯一注意的是最后一层argmax不要onnx导出。这个op用onnx导出直接导致推理结果全为0.
如果还有提示pad的错误,可以直接修改inputsize为7的整数倍,去掉pad部分的代码。
tensorrt版本本次选用8.2.3,不需要自定义plugin,layernorm ,gelu都能正确解析推理。
argmax的后处理直接用c++重写,适用于分割。