深度学习常用算子(二)

1、Tensor维度变换

1)Flatten

作用:将输入tensor中从start_axis维度到end_axis维度合并为1维

2)Reshape

作用:将输入Tensor描述转换为新的shape

3)FreespaceExtract

作用:将h维变成1,其他维度不变,从而完成对h的采样,采样值所在位置由输入的index参数决定

4)Pack

作用:Pack算子为TensorFlow原生算子,最新的版本已经改名为:Stack。该算子以指定的轴axis,将一个维度为R的张量数组转变成一个维度为R+1的张量。

5)Pad

作用:进行数据扩充

6)Permute

作用:调整Tensor的输入维度顺序

7)ShuffleChannel

作用:调整C维的排序

使用网络:ShuffleNet

8)Title

作用:将输入数据在每个维度上复制指定次数来生成输出数据

2、Tensor单个元素运算

1)Rsqrt

公式:y = 1 / sqrt{x}

2)Scale

公式:y(x)=scale*x+bias

3)AbsVal

公式:y(x)=|x|

4)Power

公式:f(x)= (scale * x + shift) ^ power

3、分类

Softmax

公式:softmax计算公式

作用:通常作为分类网络的最后一层,输出每类的概率

4、画框

1)ClipBoxes

作用:将输入的框坐标限制在[0,img_w-1]和[0,img_h-1]之间。

2)DecodeBoxes

作用:将输入框的长宽坐标转换为描点坐标(框中心点坐标和长宽),然后进行修正,修正后再替换回长宽坐标

3)DetectPostProcess

作用:

(1)对输入的框进行修正;

(2)按照得分进行排序;

(3)使用NMS进行过滤;

(4)每个分类取前N个框输出。

4)FasterRcnnPredictions

作用:获取得分最高的N个框,需要进行NMS处理。

使用网络:MaskRcnn

5)FSRDectionOutput

作用:获取得分最高的N个框,需要进行NMS处理

输入数据:每个分类的得分数据、roi坐标、roi偏移、feature map的长和宽

使用网络:FasterRcnn

6)GenerateRPNProposals

作用:根据输入rois坐标和得分,输出排序和NMS处理后的前N个框,框坐标形式为左上角和右下角

使用网络:Mask Rcnn

7)Proposal
作用:根据锚点前后得分、锚点偏移、原始图片的长宽缩放,来获取得分最高的N个预选框;

特点:对特征图上的每个点,生成scale*ratio个固定大小的窗口;即候选窗口是该算子生成的。

8)SsdDetectionOutput

作用:用来生成预测框相对原图的真实坐标,并对所有预测框进行过滤,得到最终物体检测的结果。输出的每个预测框的信息包括image id ,lable, confidence以及四个坐标值。

使用网络:SSD

8)SsdPriorBox

作用:生成预选框

使用网络:SSD

5、拼接

Concat:实现多个算子的拼接

6、旋转/缩放/平移/剪切

spatial transform

参考:https://blog.csdn.net/qq_39422642/article/details/78870629

作用:在CNN之前对feature map进行旋转、缩放、平移、剪切等操作

使用网络:Spatial Transformer Networks(STN)

  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度学习常用的上采样算子有最近邻插值、双线性插值、pixelshuffle、unpool和逆卷积。最近邻插值是一种简单的上采样方法,它根据原始图像中最近的像素值来填充新的像素。双线性插值通过对原始图像中的四个最近领域像素进行加权平均来计算新的像素值,以实现更平滑的上采样效果。pixelshuffle是一种特殊的上采样方法,它通过重排输入张量的通道来实现上采样。unpool是一种与pooling操作相对应的上采样方法,它通过保存pooling操作时的最大值位置信息来还原原始输入。逆卷积是一种基于卷积操作的上采样方法,它通过在原始图像上应用反向卷积核来增加图像的尺寸。这些上采样算子深度学习中被广泛应用于图像处理和语义分割等任务中。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [深度学习几种上采样方法代码,最近邻插值,双线性插值,pixelshuffle,unpool,逆卷积等示例代码](https://download.csdn.net/download/qq_40035462/85019559)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [深度学习中上采样方法总结](https://blog.csdn.net/Mike_honor/article/details/126538091)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值