OCRNet_Object-Contextual Representations for Semantic Segmentation-语义分割-基于物体区域的上下文信息特征提取模块基于TF2实现!!!

本文介绍了Object-Contextual Representations for Semantic Segmentation中基于自注意力机制的OCR模块,通过调整Q、K、V参数的计算,用于生成对象上下文表示。论文关键部分通过模型图和代码实例展示了如何将注意力机制应用于像素区域关系和对象区域表示上。
摘要由CSDN通过智能技术生成

简述

原文链接:Object-Contextual Representations for Semantic Segmentation
可参考代码:pytorch版
个人理解:作者借鉴了self_attention机制,在Q、K、V三个参数的输入和输出做出了相应的计算调整,用新颖的方式表征注意力机制的计算过程,但本质还是自注意力机制巧妙运用,论文具体的交代描述可自行查看原论文,或点击这里参考

OCR模块理解

论文中对于该模块的叙述也仅仅提供了一张模型图。
在这里插入图片描述
咋一眼看上去,感觉,诶,有点东西奥!仔细一看,这特么什么玩意,只给一系列名称,也不具体说说每个名字代号里面包含了什么操作。唯一能看懂的就是两个loss,三个乘法器,一个concat。(我的习惯是看这类论文就先看模型结构图,勿喷),仔细看论文内容吧,也就把这张图理解个懵懵懂懂,直到我看到这位大佬的理解图,我他妈当场就直呼好家伙!!!传送门
在这里插入图片描述
大佬就是大佬,这图一看完,代码它就不直接出来了嘛!!!

TF2代码实现

OCR模块

import tensorflow.keras.backend as K
from tensorflow import keras
import tensorflow as tf
from edge_detect.Encoder_Edge import Encoder


def OCR_gather_head(PR, SOR):

    PR = tf.reshape(PR, shape=[-1, PR.shape[1]*PR.shape[2], PR.shape[-1]])  # b hw c

    SOR = tf.reshape(SOR, shape=[-1, SOR.shape[1]*SOR.shape[2], SOR.shape[-1]])  # b hw num_classes
    SOR = tf.transpose(SOR, [0, 2, 1])  # b num_classes hw
    SOR = K.softmax(SOR)  # b num_classes hw

    object_region_representations = tf.matmul(SOR, PR)  # b num_classes c
    object_region_representations = tf.expand_dims(object_region_representations, axis=-2)  # b num_classes 1 c
    # object_region_representations = tf.transpose(object_region_representations, [0, 1, 3, 2])

    return object_region_representations


def OCR_DISTI_HEAD(PR, ORR):
    query = keras.layers.Conv2D(filters=64, kernel_size=1, padding='same')(PR)
    query = keras.layers.BatchNormalization()(query)
    query = keras.layers.Activation('relu')(query)
    query = tf.reshape(query, shape=[-1, query.shape[1]*query.shape[2], query.shape[-1]])  # b hw c1

    key = keras.layers.Conv2D(filters=64, kernel_size=1, padding='same')(ORR)
    key = keras.layers.BatchNormalization()(key)
    key = keras.layers.Activation('relu')(key)
    key = tf
  • 5
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值