计算机视觉笔记
文章平均质量分 93
听说你爱吃芒果
这个作者很懒,什么都没留下…
展开
-
matlab实现RCNN(一)
matlab实现RCNN(一)RCNNRCNN(Regions with Convolutional Neural Network Features)算法思想来自于2014年国际计算机视觉与模式识别会议(CVPR)上的经典paper《Rich feature hierarchies for Accurate Object Detection and Segmentation》,其在物体检测领域达到国原创 2017-08-15 10:35:38 · 7956 阅读 · 1 评论 -
处理点云数据(三):三维点云可视化
三维可视化点云使用Mayavi可视化首先使用anaconda安装mayavi,打开命令行界面conda install mayavi如果python版本是py3则会出错,需要安装python2.7版本:conda create -n py2 python=2然后在py2的环境下安装mayavi:conda install -n py2 mayavi如原创 2017-12-29 12:17:00 · 23387 阅读 · 7 评论 -
百度Apollo(二):障碍物感知模块
Apollo解决的障碍物感知问题: 1.高精地图ROI过滤器(HDMap ROI Filter) 2.基于卷积神经网络分割(CNN Segmentation) 3.MinBox 障碍物边框构建(MinBox Builder) 4.HM对象跟踪(HM Object Tracker) 其源码在:apollo\modules\perception\obstacle\lidar高精地图原创 2018-01-18 09:44:07 · 8930 阅读 · 0 评论 -
百度Apollo(一):代码模块
百度Apollo:https://github.com/ApolloAuto/apollo/tree/master/modules一级目录结构重要文件夹内容:docker:docker有关的文件,如启动docker脚本,进入docker容器脚本。docs:文档模块,有完整英文文档和部分中文文档 。modules:apollo中各个模块的源代码,如感知,决策,规划等核心模块。sc原创 2018-01-15 11:22:32 · 6933 阅读 · 1 评论 -
处理点云数据(五):坐标系的转换
相机的内外参矩阵坐标系主要有两类坐标系,一类为相机坐标系,一类为世界坐标系(即物体所处真实世界) 内参矩阵设空间中有一点P,若世界坐标系与相机坐标系重合,则该点在空间中的坐标为(X, Y, Z),其中Z为该点到相机光心的垂直距离。设该点在像面上的像为点p,像素坐标为(x, y)。 由上图可知,这是一个简单的相似三角形关系,从而得到 但是,图像的像素坐标系原点原创 2018-01-04 10:54:28 · 46798 阅读 · 17 评论 -
处理点云数据(六):点云分割
展示了如何在三维激光雷达数据中检测地平面和发现附近的障碍物。clear;clc;%%% for img_idx = 181:446% fid = fopen(sprintf('D:/KITTI/data_set/2011_09_26/2011_09_26_drive_0009_sync/velodyne_points/data/%010d.bin',img_idx),'rb');%原创 2018-01-24 16:23:49 · 24178 阅读 · 42 评论 -
处理点云数据(四):点云到图像平面的投影
点云到图像平面的投影坐标系的定义相机(x:右,y:下,z:前) 点云(x:前,y:左,z:上)读取传感器校准参数在KITTI数据集raw_data中有两个传感器校准参数文件calib_cam_to_cam.txt(相机到相机的校准) 和 calib_velo_to_cam.txt(点云到相机的校准)。base_dir = 'D:/KITTI/data_set/2011_09_26/2011_09原创 2018-01-03 11:15:14 · 45639 阅读 · 28 评论 -
处理点云数据(二):点云与生成前视图
创建点云数据中的前视图前视图投影为了将激光雷达传感器的前视图平面化为二维图像,必须将三维空间中的点投影到可以展开的圆柱形表面上,以将其平面化。下面公式见论文Vehicle Detection from 3D Lidar Using Fully Convolutional Network# h_res = 激光雷达的水平分辨率# v_res = 激光雷达的垂直分辨率x_img = arctan2(原创 2017-12-28 17:07:01 · 10037 阅读 · 3 评论 -
处理点云数据(一):点云与生成鸟瞰图
点云数据点云数据一般表示为N行,至少三列的numpy数组。每行对应一个单独的点,所以使用至少3个值的空间位置点(X, Y, Z)来表示。 如果点云数据来自于激光雷达传感器,那么它可能有每个点的附加值,在KITTI数据中就有一个“反射率”,这是衡量激光光束在那个位置被反射回来了多少。所以在KITTI数据中,其点云数据就是N*4的矩阵。图像与点云坐标图像的坐标轴和点云的坐标轴是不同的,下图显示了蓝原创 2017-12-28 16:06:11 · 33323 阅读 · 11 评论 -
深度学习(一):激活函数、反向传播和学习率
一、激活方法(Activation Functions)给定一个或者一组输入的节点的输出1.ReLU2. Sigmoid/Logistic3.Binary4.Tanh5.Softplus6.softmax7.Maxout8.Leaky ReLU, PReLU, RReLU, ELU, SELU, and others.二、反向传播(Backpropagation)1.这是一种用于人造神经网络的方法,原创 2017-08-28 11:41:37 · 4266 阅读 · 0 评论 -
matlab实现RCNN(二)
本文在MatlabR2016b上使用自带的深度学习工具实现RCNN来进行车辆检测。实验环境训练图片数量:825(网上收集+部分公共数据集)图片车辆数量:2300(对每张图片手工标注label得到)实验环境:MatlabR2016b(自带深度学习工具)CPU:I7-4510U显卡:NVIDIA GeForce840M(必须是N卡,因为需要使用cuda加速)内存:8G图片标注使用matlab自带的M文件原创 2017-08-15 16:47:09 · 11096 阅读 · 23 评论 -
基于点云的3D障碍物检测
基于点云的3D障碍物检测主要有以下步骤:点云数据的处理基于点云的障碍物分割障碍物边框构建点云到图像平面的投影点云数据的处理KITTI数据集KITTI数据集有四个相机,主要使用第三个相机(序号为02)拍摄的图片、标定参数和标签文件。点云数据一般表示为N行,至少三列的numpy数组。每行对应一个单独的点,所以使用至少3个值的空间位置点(X, Y, Z)来表示。 在KITTI数据中有一个原创 2018-02-08 15:32:37 · 20383 阅读 · 22 评论