深度学习常用算子

最新推荐文章于 2024-04-08 10:45:07 发布

Devere

最新推荐文章于 2024-04-08 10:45:07 发布

阅读量2.5k

点赞数 2

分类专栏： AI 文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/u013288800/article/details/120894524

版权

AI 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

深度学习常用算子

算子	功能
Relu	ReLU(x)=max(0,x)
LeakyRelu	LeakyRelu(x) = (x >= 0 ? x : x*negative_slope)
Relu6	LeakyRelu(x) = max(max(x, 0), 6)
Tan	tanh(x)=(exp(x)-exp(-x))/(exp(x)+exp(-x))
sigmoid	sigmoid(x) = 1. / (1. + exp(x))
PRelu	f(x) = max(x, 0) + slope_data[c] * min(x, 0)
Add	+
Sub	-
Mul	*
RealDiv	/
BiasAdd	用于增加bias操作，通常bias是一维Tensor
MatMul	矩阵乘
Axpy	向量求和，公式：y += a * x
EltwiseOp	多个Tensor对应位置元素进行相乘、相加、取最大值中一种操作
BatchNorm	加快神经网络的训练收敛速度
LRN	Local Response Normalization，即局部响应归一化层 LRN这个概念和运用是出现在AlexNet中。LRN最初是生物学里的概念“相邻神经元抑制”，对局部神经元的活动创建竞争机制。使用LRN增加了泛化能力（使输出中响应比较大的值变得相对更大，并抑制其他响应较小的神经元），做了平滑处理，提高了1%~2%的识别率。
SsdNormalize	作用：限制了一次归一化的范围使用网络：SSD
Convolution	分区域进行特征值提取
FullConnection	看作一种特殊卷积层，或者看作矩阵乘；整个输入作为feature map，进行特征提取FC是一种迁移学习的结果，通常FC后面接Softmax，所以FC层的功能还包括矩阵维度变换，将维度变换为Softmax对应的维度
Correlation	功能
DeConvolution	采用分步计算的方法，完成普通3D核的计算，其好处在于提升卷积计算的效率
Pooling	Pooling的作用是将输入的图像划分为若干个矩形区域，对每个子区域输出最大值或平均值。Pooling减少了参数的数量，防止过拟合现象的发生。
Mean	只有取均值功能的滑窗算子
ROIPooling	对ROI进行pooling操作，从不同大小的方框得到固定大小相应的feature maps 使用网络：Faster RCNN
ROIAlign	作用：解决ROIPooling两次量化带来的问题，使用线性插值的方式来解决。使用网络：Mask-RCNN
PSROIPooling	使用网络：R-FCN
Flatten	将输入tensor中从start_axis维度到end_axis维度合并为1维
Reshape	将输入Tensor描述转换为新的shape
FreespaceExtract	将h维变成1，其他维度不变，从而完成对h的采样，采样值所在位置由输入的index参数决定
Pack	Pack算子为TensorFlow原生算子，最新的版本已经改名为：Stack。该算子以指定的轴axis，将一个维度为R的张量数组转变成一个维度为R+1的张量。
Pad	进行数据扩充
Permute	调整Tensor的输入维度顺序
ShuffleChannel	作用：调整C维的排序使用网络：ShuffleNet
Title	将输入数据在每个维度上复制指定次数来生成输出数据
Rsqrt	y = 1 / sqrt{x}
Scale	y(x)=scale*x+bias
AbsVal	y(x)=
Power	f(x)= (scale * x + shift) ^ power
Softmax	通常作为分类网络的最后一层，输出每类的概率
ClipBoxes	将输入的框坐标限制在[0,img_w-1]和[0,img_h-1]之间。
DecodeBoxes	将输入框的长宽坐标转换为描点坐标（框中心点坐标和长宽），然后进行修正，修正后再替换回长宽坐标
DetectPostProcess	（1）对输入的框进行修正；（2）按照得分进行排序；（3）使用NMS进行过滤；（4）每个分类取前N个框输出。
FasterRcnnPredictions	获取得分最高的N个框，需要进行NMS处理。
FSRDectionOutput	作用：获取得分最高的N个框，需要进行NMS处理输入数据：每个分类的得分数据、roi坐标、roi偏移、feature map的长和宽使用网络：FasterRcnn
GenerateRPNProposals	作用：根据输入rois坐标和得分，输出排序和NMS处理后的前N个框，框坐标形式为左上角和右下角使用网络：Mask Rcnn
Proposal	作用：根据锚点前后得分、锚点偏移、原始图片的长宽缩放，来获取得分最高的N个预选框；特点：对特征图上的每个点，生成scale*ratio个固定大小的窗口；即候选窗口是该算子生成的。
SsdDetectionOutput	作用：用来生成预测框相对原图的真实坐标，并对所有预测框进行过滤，得到最终物体检测的结果。输出的每个预测框的信息包括image id ,lable, confidence以及四个坐标值。使用网络：SSD
SsdPriorBox	作用：生成预选框使用网络：SSD
Concat	实现多个算子的拼接
spatial transform	在CNN之前对feature map进行旋转、缩放、平移、剪切等操作.使用网络：Spatial Transformer Networks（STN)

Devere

关注

2
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
深度学习常用算子

深度学习常用算子算子功能ReluReLU(x)=max(0,x)LeakyReluLeakyRelu(x) = (x >= 0 ? x : x*negative_slope)Relu6LeakyRelu(x) = max(max(x, 0), 6)Tantanh(x)=(exp(x)-exp(-x))/(exp(x)+exp(-x))sigmoidsigmoid(x) = 1. / (1. + exp(x))PReluf(x) = max
复制链接

扫一扫

专栏目录