计算机视觉
文章平均质量分 71
lemianli
专注
展开
-
计算机视觉基础1——视差与深度信息
资料来源:Robert Collins,CSE486, Penn State第8讲Stereo Vision深度信息感知是人类产生立体视觉的前提。生理过程一定是相当复杂,此处,我们只从物理角度,并采用数学的方法来讨论。Inferring depth from images taken at the same time by two or more cameras.转载 2016-07-15 10:39:46 · 1133 阅读 · 0 评论 -
三维重建方法--激光or视觉
导读: 激光雷达则是无人驾驶和扫地机器人等领域的核心一环。那么为什么出现多种方案呢?它们到底有什么差异?看似很酷炫的技术,实际上并没有外界想得那么高大上。 Realsense之所以能够识别物体的深度信息,关键在于其具备三维重建功能。而能与Realsense齐名甚至是比Realsense更好的产品比比皆是,我们所知道的无人机、机器人以及无人驾驶汽车当中的壁障或路径规划等转载 2017-06-22 09:45:24 · 5597 阅读 · 0 评论 -
Ubuntu下OPENCV3.1.0+opencv_contrib-master问题总结
因为opencv3.1.0默认安装中没有加入SIFT、SURF等点特征检测,这玩意还弄了个其他的库,还只能在GitHub上才能弄到,这两天弄opencv3.1.0的contrib库,遇到了一些问题, 为了让大家更好、更快用上contrib库,根据 谷歌百度的几个问题,现分享给大家完整流程,也欢迎大家与我讨论其他opencv方面的问题。opencv_contrib的版本一定要与opencv的版本原创 2017-06-23 11:27:57 · 6214 阅读 · 1 评论 -
目标跟踪常用的视频库
1. 常用计算机视觉图像库:http://blog.csdn.net/xuejiren/article/details/38635121 //含有图像又含有是视频http://datasetfor.org/ 2.视频监控与跟踪,部分测试视频或图像序列地址:http://blog.csdn.net/zhang11wu4/article/details/8133原创 2017-07-31 10:24:03 · 6486 阅读 · 0 评论 -
Ubuntu16.04+Cuda8.0+Cudnn5.1+Opencv3.1吐血安装
Cuda驱动安装第一步:下载驱动http://www.geforce.cn/drivershttp://www.nvidia.com/Download/index.aspx?lang=cn第二步:给驱动run文件赋予权限(具体驱动名称根据自己下载的来)sudo chmod a+x NVIDIA-Linux-x86_64-375.20.run 第三步:将集成的开源驱动加入原创 2017-08-04 16:05:15 · 3758 阅读 · 1 评论 -
Anaconda+Opencv+Tensorflow安装 (Ubuntu/Windows) (cpu/gpu)
安装Anaconda 4.2 + OpenCV 3.11. 下载并安装Anaconda4.2.0 所有的Anaconda版本,Linux选Anaconda3-4.2.0-Linux-x86_64.shWindows选Anaconda3-4.2.0-Windows-x86_64.exe注意系统是64位,Tensorflow只支持windows64位。(https://mirror原创 2017-08-04 16:16:57 · 5639 阅读 · 0 评论 -
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 视频语义分割
先进入到https://github.com/TimoSaemann/caffe-segnet-cudnn5,下载caffe-segnet-cudnn5-master.zip再进入到https://github.com/alexgkendall/SegNet-Tutorial 再下载SegNet-Tutorial-master.zip准备工作:1.先准备opencv,我测试的是o...原创 2017-08-04 16:23:35 · 5524 阅读 · 1 评论 -
A Real-Time Multi-Person Keypoint Detection 实时姿态检测
下载网址:https://github.com/CMU-Perceptual-Computing-Lab/caffe_rtpose参考网址:https://github.com/CMU-Perceptual-Computing-Lab/openposehttps://github.com/CMU-Perceptual-Computing-Lab/openpose/blob/master/d...原创 2017-08-04 16:25:41 · 7104 阅读 · 1 评论 -
深度神经网络模型压缩
“本文介绍的论文全面概述了深度神经网络的压缩方法,主要可分为参数修剪与共享、低秩分解、迁移/压缩卷积滤波器和知识精炼,本论文对每一类方法的性能、相关应用、优势和缺陷等进行独到的分析。” 大型神经网络具有大量的层级与结点,因此考虑如何减少它们所需要的内存与计算量就显得极为重要,特别是对于在线学习和增量学习等实时应用。此外,近来智能可穿戴设备的流行也为研究员提供了在资源(内存、CPU、能...转载 2018-07-31 15:55:25 · 1841 阅读 · 0 评论 -
ADAS视觉方案盘点上篇:摄像头、芯片和算法
对跨学科领域来说,一个粗略的盘点只是刚刚向门内迈了一步。摄像头是ADAS核心传感器,相比毫米波雷达和激光雷达,最大优势在于识别(物体是车还是人、标志牌是什么颜色)。汽车行业价格敏感,摄像头硬件成本相对低廉,因为近几年计算机视觉发展迅速,从摄像头角度切入ADAS感知的创业公司数量也非常可观。这些创业公司可以统称为视觉方案提供商。他们掌握核心的视觉传感器算法,向下游客户提供车载摄像头模组,芯片...转载 2018-08-22 14:08:20 · 3349 阅读 · 0 评论 -
三角测量
三角测量使用对极约束估计了相机的运动,在得到运动之后,我们需要用相机的运动估计特征点的空间位置。在单目SLAM中,仅仅通过单张图像无法获得像素深度信息,需要通过三角测量来估计其深度。上图中,O1P和 O2P 理论上交与P点,但是由于噪声的存在,往往无法相交。可以通过最小二乘求解。设 x1,x2为俩个特征点的归一化坐标,那他们满足:s2x2=s1Rx1+t 由于我们已...原创 2018-08-24 09:06:38 · 12455 阅读 · 0 评论 -
Tensorflow Anaconda4.2 Cudnn
电脑软硬件配置 Gtx1070+CUDA8.0+Cudnn6.1 软件 Anaconda 4.2.0 +opencv3.2 +python3.5 (Python 2.7)几个问题一:关于Anaconda 的使用总结windows上用的tensorflow是依赖于python3.5,因此在linux下也配的3.5 一、 在Anaconda官网上下载原创 2017-06-30 10:03:02 · 3075 阅读 · 0 评论 -
Stereo Matching文献笔记:《Cross-Scale Cost Aggregation for Stereo Matching》
最近,在做立体匹配方向相关的研究,先去网上找最新鲜的论文,看到了这篇文献(简称CSCA),来源于CVPR2014,令我惊奇的是,作者竟然提供了详细的源代码,配置运行了一下,效果还真不错,速度也还可以,具有一定的实用价值,所以拿来和大家分享一下。(转载请注明:http://blog.csdn.NET/wsj998689aa/article/details/44411215, 作者:迷雾for转载 2016-11-14 20:52:11 · 2370 阅读 · 0 评论 -
深度学习与计算机视觉
目录(?)[-]众星捧月的深度学习前深度学习时代的计算机视觉几个半成功例子仿生学角度看深度学习卷积的概念操作的实例LeNet网络压在骆驼身上的最后一根稻草为什么时隔20年卷土重来深度学习在视觉上的应用人脸识别图片问答问题物体检测问题Region CNNFaster R-CNN方法SSD物体跟踪基于嵌入式系统的深度学习人工智能是人类一个非常美好的梦想,跟星际漫游和长生转载 2016-11-11 16:13:24 · 2760 阅读 · 0 评论 -
计算机视觉基础2——相机成像的几何描述
试想像一下,很多游客同时在不同角度拍摄Eiffel Tower(埃菲尔铁塔),该如何用数学的方法来描述这一过程呢?首先要解决的问题就是定位,或者说坐标选定的问题,埃菲尔铁塔只有一座,如果按经、纬度来刻画,它的坐标是唯一确定的,但游客显然不关系这一点,他(她)只按自己的喜好选择角度和位置,因此,物体(景物)有物体的坐标系统,相机有相机的坐标系统,即便同一个相机,当调整参数时,在同样的位置、相同的角度转载 2016-07-15 11:24:45 · 5421 阅读 · 0 评论 -
计算机视觉基础3——内部参数描述
在上一节中,我们用矩阵描述了外部参数,即物体的坐标到相机坐标的变换。同时还分析了透视投影,即成像的过程,整个过程就是从(U,V,W)->(X,Y,X)->(x,y)。这一节主要讨论如何从像平面(x,y)变换到数字图像(u,v),即从像平面(Film Coords)到像素(Pixel Coords)。对一幅数字图像,我们可以改变它的宽高比,即作尺度变换。转载 2016-07-15 15:05:48 · 2217 阅读 · 0 评论 -
共面点成像——planar homography
在前面已经讨论了三维物体成像过程,相比之下,还有一种稍简单的情况——平面成像,即所有的物点都处在同一个平面上,我们有理由相信,这种情况下的成像关系是一般立体成像的一种特例。先回顾一下一般的单体成像过程 对于共面的物点,在恰当的世界坐标系中,可以令其中一个坐标值为0,不妨设第三维坐标为0,图示如下:由于物点的第三维坐标为0,整个转载 2016-07-15 15:18:28 · 3212 阅读 · 0 评论 -
计算机视觉基础4——对极几何(Epipolar Geometry)
先思考一个问题:用两个相机在不同的位置拍摄同一物体,如果两张照片中的景物有重叠的部分,我们有理由相信,这两张照片之间存在一定的对应关系,本节的任务就是如何描述它们之间的对应关系,描述工具是对极几何 ,它是研究立体视觉的重要数学方法。 要寻找两幅图像之间的对应关系,最直接的方法就是逐点匹配,如果加以一定的约束条件对极约束(epipolar constraint),搜索的范围可以大大减小。转载 2016-07-15 15:44:02 · 18070 阅读 · 1 评论 -
TLD Tracker
Kalal是英国萨里大学的一个捷克学生。他演示的是他的神奇的精确定位系统,这个系统几乎可以跟踪镜头里的任何物体,只要你能看见它,并把它选中。它能 做很多神情的事情。在这个视频中,他演示了通过摄像机拍摄他的手指、把他的手指选做目标。系统于是就能精确的跟踪他的手指的动作。更令人惊奇的是,这个系 统能够通过分析物体的运动来完善跟踪算法。你能在很短的时间里教会它跟踪你的手指、面孔或在高速公路上狂颠的轿车。转载 2016-07-15 16:37:35 · 2043 阅读 · 0 评论 -
机器学习之正则化(Regularization)
1. The Problem of Overfitting1还是来看预测房价的这个例子,我们先对该数据做线性回归,也就是左边第一张图。如果这么做,我们可以获得拟合数据的这样一条直线,但是,实际上这并不是一个很好的模型。我们看看这些数据,很明显,随着房子面积增大,住房价格的变化趋于稳定或者说越往右越平缓。因此线性回归并没有很好拟合训练数据。我们把此类情况称为欠转载 2016-08-06 10:42:48 · 2336 阅读 · 0 评论 -
vs2013编译zlib1.2.8库解决方案
一、zlib库的编译 首先要下载这个库,我下载的是zlib-1.2.8,下载完解压出来即可。下边就开始编译吧。(包括动态库和静态库两种)1. 首先开启VS2013的Command Prompt (32bit),也就是命令提示窗口。2. 进入到zlib-1.2.5/contrib/masmx86目录,执行bld_ml32.bat。(同理,64位的电脑进入masmx64目录,执行bl转载 2016-09-09 15:54:32 · 4321 阅读 · 0 评论 -
VS 编译libpng和zlib
libpng用于图片处理,zlib用于压缩。两者密切相关,libpng依赖zlib。编译库:1. 先下载 libpng(http://sourceforge.net/projects/libpng/files/)和libz(http://zlib.net/zlib-1.2.7.tar.gz),将libpng解压,如C:\workspace\libpng\。2.原创 2016-08-13 16:25:28 · 8140 阅读 · 0 评论 -
块坐标下降法(Block Coodinate Descent)
问题的描述:给定一个可微的凸函数,如果在某一点x,使得f(x)在每一个坐标轴上都是最小值,那么f(x)是不是一个全局的最小值。形式化的描述为:是不是对于所有的d,i都有这里的代表第i个标准基向量。答案为成立。这是因为:但是问题来了,如果对于凸函数f,若不可微该会怎样呢?答案为不成立,上面的图片就给出了一个反例。转载 2016-09-21 16:27:02 · 33698 阅读 · 2 评论 -
立体匹配研究背景及意义
计算机视觉是一门研究使用计算机来模拟人的视觉系统的学科。“一图胜千言”,人类对于图像中的信息感知效率远超文字等其他媒介,人类获取的信息总量中更是有高达80%依靠视觉系统[1]。相对于人类高效的图像信息提取能力,计算机在图像信息的理解上仍然效率低下。 计算机视觉作为一门交叉学科,综合了生物学,心理学,数学,计算机科学等学科,从20世纪60年代至今其在科学研究领域中的大量成果已经应用于工程领域,并转载 2016-10-28 15:33:16 · 10097 阅读 · 0 评论 -
畸变矫正及像素损失分析
上一篇博客简要介绍了一下常用的张正友标定法的流程,其中获取了摄像机的内参矩阵K,和畸变系数D。1.在普通相机cv模型中,畸变系数主要有下面几个:(k1; k2; p1; p2[; k3[; k4; k5; k6]] ,其中最常用的是前面四个,k1,k2为径向畸变系数,p1,p2为切向畸变系数。2.在fisheye模型中,畸变系数主要有下面几个(k1,k2,k3,k4). 因为cv和...原创 2018-12-21 15:36:38 · 8330 阅读 · 3 评论