PCL库学习九(形状、调谐、旋转图像描述子)

论文原文:Recognizing Objects in Range Data Using Regional Point Descriptors

论文阅读:在距离数据中使用区域点描述子识别目标

  1. 简介
  • 介绍了两种区域描述子,适用于复杂环境的3d物体识别
  • 3d物体识别中存在的问题:
    (1)存在遮挡:
    (2)存在许多相似形状和大小相似物体
    (3)距离扫描仪器的分辨率不够
    (4) 高速扫描时会存在显著噪声
  1. 描述子
  • 设计描述符时需要考虑如下问题:
    (1)支撑区域形状:分为若干个自取与,计算每个自取的直方图
    (2)如何在三维空间的直方图上映射光束:通过对齐到支撑区域,原点曲面方向的北向,同时方位角会存在一定自由度
    如下描述符均采用输入点及其残差和支撑区域,计算描述符,3种方法采用不同消除自度的方法和支撑平面形状
  • 3D局部形状描述符(3D shape contexts)SC
    <1>: 是2d shape contexts直接扩展而来,以p为圆点构建了一个圆(其北向为点p切平面方向)。见下图:
    在这里插入图片描述
    <2>:支撑区域:按方位角、俯仰角等分,记:
    J + 1 J+1 J+1:个径向半径为: R = { R 0 , . . . , R J } R=\{R_0,...,R_J\} R={R0,...,RJ}
    K + 1 K+1 K+1:个俯仰角为: Θ = { Θ 0 , . . , Θ k } \Theta=\{\Theta_0,..,\Theta_k\} Θ={Θ0,..,Θk}
    L + 1 L+1 L+1:个俯仰角为: Φ = { Φ 0 , . . , Φ k } \Phi=\{\Phi_0,..,\Phi_k\} Φ={Φ0,..,Φk}
    <3>:每个区域用 J × K × L J×K×L J×K×L表示:
    r m i n = R 0 r_{min}=R_0 rmin=R0
    r m a x = R J r_{max}=R_J rmax=RJ
    R j = exp ⁡ { l n ( r m i n ) + j J l n ( r m a x r m i n ) } R_j=\exp\{ln(r_{min})+\frac{j}{J}ln(\frac{r_{} max}{r_{min}})\} Rj=exp{ln(rmin)+Jjln(rminrmax)}
    <4>:权重:每个区域 ( j , k , l ) ∈ { [ R j , R j + 1 ) , [ Φ k , Φ k + 1 ) , [ Θ l , Θ l + 1 ) } (j,k,l)\in\{ [R_j,R_{j+1}),[\Phi_k,\Phi_{k+1}),[\Theta_l,\Theta_{l+1})\} (j,k,l){[Rj,Rj+1),[Φk,Φk+1),[Θl,Θl+1)}对应一个权重 w ( p i ) w(p_i) w(pi):
    V ( j , k , l ) : V(j,k,l): V(j,k,l):容积
    p i : p_i: pi:局部区域强度
    w ( p i ) = 1 p i V ( j , k , l ) w(p_i)=\frac{1}{p_i\sqrt{V(j,k,l)}} w(pi)=piV(j,k,l) 1
    <5>:为了进行更好的比较,去除方位角上的自由度,选择 Φ 0 \Phi_0 Φ0作为初始的shape context(局部描述符),然后旋转局部描述符到L的北极仿效
  • 局部调谐描述符(论文只简单介绍,详细要见其第14个参考文献)HSC
    对区域采样来计算球谐函数,描述符是在方位角上不变的幅值向量,移除了在方位角上的自由度,保留了临近点的信息具有更好的描述性。
    调谐函数的基函数如下:该基函数将会在方位角的频域方向产生一个相位移动
    A l m : A_l^m: Alm:振幅
    f ( θ , ϕ ) = ∑ l = 0 ∞ ∑ m = − l m = l A l m Y l m ( θ , ϕ ) f(\theta,\phi)=\sum_{l=0}^\infty\sum^{m=l}_{m=-l}A_l^mY_l^m(\theta,\phi) f(θ,ϕ)=l=0m=lm=lAlmYlm(θ,ϕ)
    3D形状定义指定小块的球谐描述符 f j ( θ , ϕ ) f_j(\theta,\phi) fj(θ,ϕ)
    R j ≤ R ≤ R j + 1 R_j \leq R \leq R_{j+1} RjRRj+1
    S C : 3 D 形 状 描 述 符 SC:3D形状描述符 SC:3D
    f j ( θ , ϕ ) = S C ( j , k , l ) , θ k < θ ≤ θ k + 1 , ϕ l < ϕ < ϕ l + 1 f_j(\theta,\phi)=SC(j,k,l),\theta_k<\theta \leq \theta_{k+1},\phi_l<\phi<\phi_{l+1} fj(θ,ϕ)=SC(j,k,l),θk<θθk+1,ϕl<ϕ<ϕl+1
    频宽 b b b:描述符只存储谐波的最低频分量的带宽,公式如下:
    H S C ( l , m . k ) = ∣ ∣ A l , k m ∣ ∣ , ( l , m = 0 , . . . , b ) ( r = 0 , . . . , K ) m > = 0 HSC(l,m.k)=||A^m_{l,k}||,(l,m=0,...,b)(r=0,...,K)m>=0 HSC(l,m.k)=Al,km,(l,m=0,...,b)(r=0,...,K)m>=0
    得到球谐函数的维数为: K ∗ b ( b + 1 ) 2 K*\frac{b(b+1)}{2} K2b(b+1),不受方位角和俯仰角划分数量影响
    S H ( f ) : SH(f): SH(f):关于b的向量,用来描述全局形状 S H l ( f ) = ∣ ∣ ∑ m − l l A l m Y l m ∣ ∣ SH_l(f)=||\sum_{m-l}^lA_l^mY_l^m|| SHl(f)=mllAlmYlm
  • spin-image 描述符SI
    最常用的3D描述符在识别、建模、分类上广泛应用。
    支撑平面:以点p为中心,半径为r,高度为h,其轴线与点p的切平平面法线对齐。
    支撑平面的划分:J方向:径向,K:垂直方向,形成 j × K j×K j×K的圆环,通过计算每个环内的梯度得到基于点P的自旋图像,形成2D直方图。
    每个点 p i p_i pi的权重 q i q_i qi是该点的强度值的逆,每个环内求和消除方位角方向上的自由度,使自旋图像具有旋转不变性,具有 J × K J×K J×K为特征向量
  1. 使用描述点做匹配
  • 局部形状描述符和3D旋装描述符:使用两特征向量之间的距离,作为准确度
  • 局部调谐描述符:使用协防差矩阵的归一化函数的逆,作为准确度
  • Representative descriptor method:方法进行匹配
    已知:
    p 1 , . . . , p M : p_1,...,p_M: p1,...,pM:每次扫描 S i S_i Si产生M个描述符
    q 1 , . . . , q k : q_1,...,q_k: q1,...,qk:用来查询的k个描述符
    k < < M : k<< M: k<<M:用来查询的k个描述符称之为Representative descriptor (RDS)
    对于每次扫描 S i S_i Si,和一个描述符 q k q_k qk,可以从 S i S_i Si产生的描述符中找到与 q k q_k qk距离最小的点 p m p_m pm,距离为 l 2 l_2 l2,让后将所有查询点 q k q_k qk相对于 p m p_m pm的距离求和,得到的值成为representative descriptor cost(描述子残差):最佳匹配的点 c o s t ( S q , S i ) cost(S_q,S_i) cost(Sq,Si)值最小
    c o s t ( S q , S i ) = ∑ k ∈ { 1 , . . , k } m i n m ∈ { 1 , . . . , M } d i s t ( q k , p m ) cost(S_q,S_i)=\sum_{k\in\{1,..,k\}}min_{m\in\{1,...,M\}dist(q_k,p_m)} cost(Sq,Si)=k{1,..,k}minm{1,...,M}dist(qk,pm)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值