R-FCN中k^2(C+1)和z(i,j,c)的理解

    关于R-FCN论文的讲解,网上有很多资料,在这里重缀了。这里只对其中的核心图做讲解。

    假设c+1类中有一类是人脸,下图中k=3,对应的可以找到人脸的左上部对应的特征向量的。相当于把c+1类又细分了,每一类里面有k*k个位置细分类。

    解释上图,其中feature maps对应 下面网络图 中 con_new_1[1024*w*h](res5c是2048*w*h,这一层1024*1*1的全卷积降维操作)

    position-sensitive score maps(以下简称ps层),为什么是k^2(c+1)维度呢?一般不都是c+1维吗?k^2的加入才是position-sensitive的关键,因为一般的conv+pool具体平移不变性,对于检测任务位置的定位不敏感,所以需要改变。

    每个feature map,z(i,j,c)是第i+k(j-1)个立体块上的第c个map(1<= i,j <=3)。(i,j)决定了9种位置的某一种位置,假设为左上角位置(i=j=1),c决定了哪一类,假设为person类。在z(i,j,c)这个feature map上的某一个像素的位置是(x,y),像素值是value,则value表示的是原图对应的(x,y)这个位置上可能是人(c=‘person’)且是人的左上部位(i=j=1)的概率值。

    这里k^2共有k*k = 9个颜色(成为9个bin)(示意图中k=3,实际中默认k=7),每个颜色的立体块(W*H*(C+1))表示的是不同位置存在目标的概率值(第一块黄色表示的是左上角位置,最后一块淡蓝色表示的是右下角位置)。共有k^2*(C+1)个feature map。每个feature map,z(i,j,c)是第i共有k*k = 9个颜色,每个颜色的立体块(W*H*(C+1))表示的是不同位置存在目标的概率值(第一块黄色表示的是左上角位置,最后一块淡蓝色表示的是右下角位置)。共有k^2*(C+1)个feature map。

                        


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
>> function [sa,sb,sc] = fcn(Ts,L1,L2,C2,udc,uca,ucb,ucc,i1a,i1b,i1c,i2a,i2b,i2c,i2refa,i2refb,i2refc,ucrefa,ucrefb,ucrefc,ea,eb,ec,i1refa,i1refb,i1refc) K1=Ts/L2;temp=0;C=0;P=0;mpc=1;sa=0;sb=0;sc=0;K2=Ts/C2;K3=Ts/L1; w1=1; w2=0.7; w3=20; g=[0 0 0 0 0 0 0 0]; h=[0 0 0 0 0 0 0 0]; k=[0 0 0 0 0 0 0 0]; z=[0 0 0 0 0 0 0 0]; g(1)=abs(i2refa-i2a-K1*(uca-udc*0))+abs(i2refb-i2b-K1*(ucb-udc*0))+abs(i2refc-i2c-K1*(ucc-udc*0)); g(2)=abs(i2refa-i2a-K1*(uca-udc*(-1/3)))+abs(i2refb-i2b-K1*(ucb-udc*(-1/3)))+abs(i2refc-i2c-K1*(ucc-udc*(2/3))); g(3)=abs(i2refa-i2a-K1*(uca-udc*(-1/3)))+abs(i2refb-i2b-K1*(ucb-udc*(2/3)))+abs(i2refc-i2c-K1*(ucc-udc*(-1/3))); g(4)=abs(i2refa-i2a-K1*(uca-udc*(-2/3)))+abs(i2refb-i2b-K1*(ucb-udc*(1/3)))+abs(i2refc-i2c-K1*(ucc-udc*(1/3))); g(5)=abs(i2refa-i2a-K1*(uca-udc*(2/3)))+abs(i2refb-i2b-K1*(ucb-udc*(-1/3)))+abs(i2refc-i2c-K1*(ucc-udc*(-1/3))); g(6)=abs(i2refa-i2a-K1*(uca-udc*(1/3)))+abs(i2refb-i2b-K1*(ucb-udc*(-2/3)))+abs(i2refc-i2c-K1*(ucc-udc*(1/3))); g(7)=abs(i2refa-i2a-K1*(uca-udc*(1/3)))+abs(i2refb-i2b-K1*(ucb-udc*(1/3)))+abs(i2refc-i2c-K1*(ucc-udc*(-2/3))); g(8)=abs(i2refa-i2a-K1*(uca-udc*0))+abs(i2refb-i2b-K1*(ucb-udc*0))+abs(i2refc-i2c-K1*(ucc-udc*0)); % for P=1:8 % z(P)=w1*g(P)+w2*h(P)+w3*k(P); % end % temp=z(1); % for C=1:8 % if z(C)<temp % temp=z(C); % mpc=C; % end % end switch mpc case 1 sa=0;sb=0;sc=0; case 2 sa=0;sb=0;sc=1; case 3 sa=0;sb=1;sc=0; case 4 sa=0;sb=1;sc=1; case 5 sa=1;sb=0;sc=0; case 6 sa=1;sb=0;sc=1; case 7 sa=1;sb=1;sc=0; case 8 sa=1;sb=1;sc=1; otherwise sa=0;sb=0;sc=0; end 这是matlab function的一段代码如何修改代码找出使g输出最小的四个输入状态
最新发布
05-23
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值