VSLAM算法(二):PnP求解 3D-2D 相机位姿及 BA优化算法

BA优化模型如下:优化变量(空间位置P和相机位姿),边(P在相机平面的投影像素坐标)

             

 // 调用OpenCV 的 PnP 求解,可选择EPNP,DLS等方法
 solvePnP ( pts_3d, pts_2d, K, Mat(), r, t, false );
 
 cv::Rodrigues ( r, R ); // r为旋转向量形式,用Rodrigues公式转换为矩阵
void bundleAdjustment (
    const vector< Point3f > points_3d,
    const vector< Point2f > points_2d,
    const Mat& K,
    Mat& R, Mat& t )
{
    // 初始化g2o
    typedef g2o::BlockSolver< g2o::BlockSolverTraits<6,3> > Block;  // pose 维度为 6, landmark 维度为 3
    //Block::LinearSolverType* linearSolver = new g2o::LinearSolverCSparse<Block::PoseMatrixType>(); // 线性方程求解器
	std::unique_ptr<Block::LinearSolverType> linearSolver ( new g2o::LinearSolverCSparse<Block::PoseMatrixType>());

	//Block* solver_ptr = new Block ( linearSolver );     // 矩阵块求解器
	//std::unique_ptr<Block> solver_ptr ( new Block ( linearSolver));
	std::unique_ptr<Block> solver_ptr ( new Block ( std::move(linearSolver)));	   // 矩阵块求解器

	//g2o::OptimizationAlgorithmLevenberg* solver = new g2o::OptimizationAlgorithmLevenberg ( solver_ptr );
	g2o::OptimizationAlgorithmLevenberg* solver = new g2o::OptimizationAlgorithmLevenberg ( std::move(solver_ptr));

	g2o::SparseOptimizer optimizer;
    optimizer.setAlgorithm ( solver );

	//申明一个位姿优化模型
    // vertex
    g2o::VertexSE3Expmap* pose = new g2o::VertexSE3Expmap(); // camera pose
    Eigen::Matrix3d R_mat;
    R_mat <<
          R.at<double> ( 0,0 ), R.at<double> ( 0,1 ), R.at<double> ( 0,2 ),
               R.at<double> ( 1,0 ), R.at<double> ( 1,1 ), R.at<double> ( 1,2 ),
               R.at<double> ( 2,0 ), R.at<double> ( 2,1 ), R.at<double> ( 2,2 );
    pose->setId ( 0 );
    pose->setEstimate ( g2o::SE3Quat (
                            R_mat,
                            Eigen::Vector3d ( t.at<double> ( 0,0 ), t.at<double> ( 1,0 ), t.at<double> ( 2,0 ) )
                        ) );
    optimizer.addVertex ( pose );
	//添加3D路标点
    int index = 1;
    for ( const Point3f p:points_3d )   // landmarks
    {
        g2o::VertexSBAPointXYZ* point = new g2o::VertexSBAPointXYZ();
        point->setId ( index++ );
        point->setEstimate ( Eigen::Vector3d ( p.x, p.y, p.z ) );
        point->setMarginalized ( true ); // g2o 中必须设置 marg 参见第十讲内容
        optimizer.addVertex ( point );
    }

    // 添加相机参数 parameter: camera intrinsics
    g2o::CameraParameters* camera = new g2o::CameraParameters (
        K.at<double> ( 0,0 ), Eigen::Vector2d ( K.at<double> ( 0,2 ), K.at<double> ( 1,2 ) ), 0
    );
    camera->setId ( 0 );
    optimizer.addParameter ( camera );

    //添加边 edges
    index = 1;
    for ( const Point2f p:points_2d )
    {
        g2o::EdgeProjectXYZ2UV* edge = new g2o::EdgeProjectXYZ2UV();
        edge->setId ( index );
        edge->setVertex ( 0, dynamic_cast<g2o::VertexSBAPointXYZ*> ( optimizer.vertex ( index ) ) );
        edge->setVertex ( 1, pose );
        edge->setMeasurement ( Eigen::Vector2d ( p.x, p.y ) );
        edge->setParameterId ( 0,0 );
        edge->setInformation ( Eigen::Matrix2d::Identity() );
        optimizer.addEdge ( edge );
        index++;
    }

    chrono::steady_clock::time_point t1 = chrono::steady_clock::now();
    optimizer.setVerbose ( true );
    optimizer.initializeOptimization();
    optimizer.optimize ( 100 );
    chrono::steady_clock::time_point t2 = chrono::steady_clock::now();
    chrono::duration<double> time_used = chrono::duration_cast<chrono::duration<double>> ( t2-t1 );
    cout<<"optimization costs time: "<<time_used.count() <<" seconds."<<endl;

    cout<<endl<<"after optimization:"<<endl;
    cout<<"T="<<endl<<Eigen::Isometry3d ( pose->estimate() ).matrix() <<endl;
}

PnP 函数原型:

void solvePnP(InputArray objectPoints,
              InputArray imagePoints,
              InputArray cameraMatrix, 
              InputArray distCoeffs,
              OutputArray rvec, 
              OutputArray tvec,
              bool useExtrinsicGuess=false, 
              int flags = CV_ITERATIVE
             )
参数解释:
objectPoints:世界坐标系中的3D点坐标,单位mm
imagePoints:图像坐标系中点的坐标,单位像素
cameraMatrix:相机内参矩阵
distCoeffs:畸变系数
rvec:旋转矩阵——》是向量形式,需用Rodrigues转换成旋转矩阵形式
tvec:平移矩阵
useExtrinsicGuess:是否输出平移矩阵和旋转矩阵,默认为false
flags:SOLVEPNP _ITERATIVE、SOLVEPNP _P3P、SOLVEPNP _EPNP、SOLVEPNP _DLS、SOLVEPNP _UPNP
----------------------------------------------------------------------------------------
objectPoints - 世界坐标系下的控制点的坐标,vector<Point3f>的数据类型在这里可以使用
imagePoints - 在图像坐标系下对应的控制点的坐标。vector<Point2f>在这里可以使用
cameraMatrix - 相机的内参矩阵
distCoeffs - 相机的畸变系数
以上两个参数通过相机标定可以得到。相机的内参数的标定参见:http://www.cnblogs.com/star91/p/6012425.html
rvec - 输出的旋转向量。使坐标点从世界坐标系旋转到相机坐标系
tvec - 输出的平移向量。使坐标点从世界坐标系平移到相机坐标系
flags - 默认使用CV_ITERATIV迭代法

作者:喻茸sophie
链接:https://www.jianshu.com/p/b97406d8833c
ushort d = d1.ptr<unsigned short> (int ( keypoints_1[m.queryIdx].pt.y )) [ int ( keypoints_1[m.queryIdx].pt.x ) ];
/*
  * 这个m的类型:DMatch
  * DMatch主要用来储存匹配信息的结构体,query是要匹配的描述子,train是被匹配的描述子;
  * 在Opencv中进行匹配时
  * void DescriptorMatcher::match( const Mat& queryDescriptors,
                                   const Mat& trainDescriptors, 
                                   vector<DMatch>& matches, 
                                   const Mat& mask 
                                 ) const
  * match函数的参数中位置在前面的为query descriptor,后面的是 train descriptor
  * 例如:query descriptor的数目为20,train descriptor数目为30,则DescriptorMatcher::match后的vector<DMatch>的size为20
  * 若反过来,则vector<DMatch>的size为30
 */ 
struct CV_EXPORTS_W_SIMPLE DMatch 
{ 
    //默认构造函数,FLT_MAX是无穷大 
    //#define FLT_MAX         3.402823466e+38F        /* max value */ 
    CV_WRAP DMatch() : queryIdx(-1), trainIdx(-1), imgIdx(-1), distance(FLT_MAX) {} 
    //DMatch构造函数 
    CV_WRAP DMatch( int _queryIdx, int _trainIdx, float _distance ) : 
            queryIdx(_queryIdx), trainIdx(_trainIdx), imgIdx(-1), distance(_distance) {} 
    //DMatch构造函数 
    CV_WRAP DMatch( int _queryIdx, int _trainIdx, int _imgIdx, float _distance ) : 
            queryIdx(_queryIdx), trainIdx(_trainIdx), imgIdx(_imgIdx), distance(_distance) {} 

    //queryIdx为query描述子的索引,match函数中前面的那个描述子 
    CV_PROP_RW int queryIdx; // query descriptor index 
    //trainIdx为train描述子的索引,match函数中后面的那个描述子 
    CV_PROP_RW int trainIdx; // train descriptor index 
    //imgIdx为进行匹配图像的索引 
    //例如已知一幅图像的sift描述子,与其他十幅图像的描述子进行匹配,找最相似的图像,则imgIdx此时就有用了。 
    CV_PROP_RW int imgIdx;   // train image index 
    //distance为两个描述子之间的距离 
    CV_PROP_RW float distance; 
    //DMatch比较运算符重载,比较的是DMatch中的distance,小于为true,否则为false 
    // less is better 
    bool operator<( const DMatch &m ) const 
    { 
        return distance < m.distance; 
    } 
};  
原文:https://blog.csdn.net/robinhjwy/article/details/77801950 

 

  • 0
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SLAM是指“同步定位和地图构建”(Simultaneous Localization and Mapping)的缩写,它是一种在没有先验地图的情况下,利用传感器信息实现自主定位和构建环境地图的技术。其中,LDS、VSlam、RGBD和IMU都是用于实现SLAM的传感器或技术。 1. LDS(激光雷达) LDS是目前应用最广泛的SLAM传感器之一。它通过激光束测量出环境中的物体和障碍物的位置和距离,进而实现自主定位和地图构建。LDS具有高精度、高稳定性和高可靠性等优点,能够应对大多数复杂环境下的定位和建图任务。但它的缺点是价格昂贵,且对环境有一定的要求,需要有明显的反射面才能进行测量。 2. VSlam(视觉SLAM) VSlam利用相机等视觉传感器采集环境图像,通过计算图像间的运动关系来实现自主定位和地图构建。它具有传感器成本低、安装方便、可实现小型化等优点,但由于光照、阴影等原因,其稳定性和鲁棒性相对较差,而且在低纹理和无纹理的环境下效果不佳。 3. RGBD(深度相机) RGBD相机可以同时获得彩色图像和深度信息,能够提供更丰富的环境信息,进而实现更准确的自主定位和地图构建。它的优点是不受环境光照和反射的影响,对低纹理和无纹理的环境也有较好的适应性。但其价格较高,相对复杂,需要额外的计算资源来处理深度图像。 4. IMU(惯性测量单元) IMU是一种能够测量加速度和角速度的传感器,常常与其他传感器一起使用来实现SLAM。它的优点是响应速度快、成本低,可以提供独立的姿态估计,能够在缺少其它传感器信息的情况下进行自主定位。但它的精度和稳定性相对较差,容易受到噪声和累积误差的影响。 在实际应用中,不同的SLAM技术和传感器可以互相结合使用,以达到更高的精度和鲁棒性。目前,

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值