详解Tensorrt构建算子(一)
一、NvIfer.h内容详解:(首先包含NvInferRuntime.h,使用其内部定义内容。)
1)nvifer1 namespace :表示的是这一版本均放在这一个命名空间内部。包括:Dims2-HW、3-CHW、4-NCHW维度的数据;LayerType:实现的网络层类型综合,如:CONVOLUTION,FULLY_CONNECTED,ACTIVATION,POOLING等常见算子共34种嗷;
ITensor-CLASS:网络中的Tensor定义,主要包括:SetName:设置tensor名称(Get),setDimensions:改变输入的维度信息,因为输出是由输入和模型结构得到的,所以不设置输出的维度信息;setType:设置数据类型(只对输入和输出生效,内部不生效);setDynamicRange():设置Tensor的值的最大最小值-float类型;isNetworkInput():判断是否是输入、输出tensor;setBroadcastAcrossBatch():主要针对输入Tensor的,设置统一批次内的多个tensor存储在一个地址中,且使用exlpicit batch network model时失效;
getLocation:得到存储位置;isExecutionTensor():通常都是ci类型。
ILayer-CLASS:网络中各具体计算层的基类。 getType():获取层的类型(34分之一);setName():设置层的名字;getNbInputs():获取输入层的编号;setInput():用一个具体的tensor替代层内指定编号的Inputs,有些层不适用;setPrecision:可以显示的指定计算精度,默认tensorrt会自动选择合适的精度;precisionIsSet():是否显示的设置精度了;resetPrecision():恢复默认精度;setOutPutType():只是改变获取到的数据类型,不会对模型内部的真实值进行改变,相当于开辟了一个独立空间而已;PaddingMode:六种填充模式;
IConvolutionLayer:卷积层,继承自ILayer-class; getKernelSize():核的大小;setNbOutputMaps():设置输出层数;
IFullyConectedLayer:全连接层,继承自ILayer-class;
IActivationLayer:激活函数层,继承自ILayer-class;
IPoolingType:池化层,,继承自ILayer-class;
ILRNLayer:局部相应归一化层,继承自ILayer-class;
Scale layer层:包含ScaleModel类型,里面的coefficients可以设置每通道,每个tensor每个元素等;
ISoftMaxPlayer:分类层;每个输出通道进行一次分类;
IConcatentionLayer-class:拼接层;
IDeconvolutionLayer-class:解卷积层;
IElementWiseLayer-class:二进制数操作;