计算机视觉
肉丸不肉
这个作者很懒,什么都没留下…
展开
-
国科大人工智能学院《计算机视觉》课 —ޮ典型视觉应用和系统
一、基于图像的大规模场景建模系统:SFM、MVS二、机器人视觉导航与定位系统:SLAMQ:把一个机器人放到未知环境里,它该怎么运动?主要思路是:把这个环境的场景结构建模出来,再给机器人一个运动轨迹让它走。然后建模场景结构有两个思路,一个是事先离线建好,让机器人随意走动,拍很多不同角度的图片,算法就是SFM(从运动恢复结构);二是让机器人边走边建模场景,算法就是SLAM地图在哪里?— 建模场景结构(环境地图)“我在哪里”原创 2021-06-14 23:55:38 · 564 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —物体表达
一、背景内容二、面向识别任务的物体表达原创 2021-06-14 16:38:49 · 435 阅读 · 1 评论 -
国科大人工智能学院《计算机视觉》课 —计算机视觉中的机器学习方法
一、背景内容二、计算机视觉中的机器学习方法:子空间分析(PCA、ICA、LDA)PCA的应用:三、计算机视觉中的机器学习方法:流行学习(LLE、Isomap、Laplacian Eigenmap)四、计算机视觉中的机器学习方法:稀疏表达1范数:有唯一解、是凸函数五、计算机视觉中的机器学习方法:低秩表达...原创 2021-06-14 15:26:20 · 11740 阅读 · 4 评论 -
国科大人工智能学院《计算机视觉》课 —计算机视觉常用优化方法
一、稀疏捆绑调整二、误差反向传播算法三、马尔科夫随机场四、条件随机场原创 2021-06-14 14:22:26 · 508 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —运动视觉—运动表达和行为识别
一、运动表达和行为分析的背景内容二、运动表达:运动轨迹、时空图(运动能量图、运动历史图)三、行为识别1. 行为识别方法分类:基于模板匹配的方法(时间模板、动态时间规整)2. 行为识别方法分类:基于状态转移图模型的方法3. 行为识别方法分类:基于深度学习的方法...原创 2021-06-13 16:55:32 · 537 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —运动视觉—视觉跟踪(目标跟踪、视觉定位)
一、视觉跟踪 的前奏知识1. 什么是跟踪:目标跟踪、相机跟踪2. 目标跟踪的问题分类3. 目标跟踪的应用:行为分析、虚拟现实、增强现实等二、目标跟踪:传统跟踪方法、基于神经网络的跟踪方法1. 运动目标的表示方法:基于点、区域、轮廓、模型的跟踪2. 传统目标跟踪方法:先表示,再追踪(自底向上《数据驱动》和自顶向下《模型驱动》)模板匹配法:基于卡尔曼滤波器的跟踪方法:相关滤波与跟踪(MOSSE):3. 基于DNN的跟踪方法三、视觉定位原创 2021-06-13 14:46:33 · 1099 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —运动视觉—运动检测
零、运动分析:视频图像分析一、运动检测的概念运动检测定义:将运动前景从图像序列中提取出来,即 将背景与运行前景 区分开。运动检测的意义:是目标跟踪、运动表述和行为理解等后续处理的基础。运动检测的难点:运动检测的两种常见思路:直接利用前景所特有的信息检测前景:适用于前景特征变化不大的场景先得到背景图像,然后将输入图像减去背景图像从而得到前景图像:适用于背景相对固定,而前景变化较大的场景二、常规的运动检测方法1. 背景差法原理:计算当前图像与背景图像的逐像素的灰原创 2021-06-13 00:57:05 · 1678 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —三维视觉—三维表达与语义建模
一、三维建模的方式:SFM+MVS、X(明暗、光度立体、纹理、焦点)二、点云网格建模1. 小场景的点云网格化算法2. 大场景的点云网格化算法:分布式点云网格化三、三维语义建模1. 三维语义分割:基于几何特征2. 三维语义分割:基于模板匹配3. 三维语义分割:端到端分割4. 二维图像分割的三维融合5. 语义和几何的联合优化四、三维矢量建模...原创 2021-06-12 16:55:26 · 782 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —三维视觉—立体视觉与三维建模
稠密点云 重建原创 2021-06-12 15:45:33 · 1224 阅读 · 1 评论 -
国科大人工智能学院《计算机视觉》课 —三维视觉—相机标定与稀疏重建
一、三角化:求X二、相机标定:求K、R、t(K是同一个)投影矩阵P有11个自由度。三维标定物:只需一幅图像平面标定板:至少需要三幅图像除了三维标定物和二维标定平面外,还可以利用消影点进行标定。单应矩阵:基本矩阵单应矩阵本质矩阵投影矩阵三、姿态估计:求R、t最少为 P3P四、稀疏重建 SFM:求K、R、t、X所以K假设已知,实则为多少呢?五、重投影误差最小化问题的求解...原创 2021-06-11 01:10:10 · 648 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —三维视觉—相机模型与多视几何
111原创 2021-06-09 21:00:18 · 1028 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —底层视觉—图像分割
一、早期的图像分割方法:阈值法、基于边缘信息的分割方法图像分割:把图像分成互不重叠的区域并提取出感兴趣目标的技术和过程。图像分割的基本依据:区域内的一致性、区域间的不一致性阈值法:局部阈值法:将图像分块,分别用全局阈值方法分割,最后再综合。基于边缘的分割方法:先检测边缘再根据边缘将图像分割成不同的区域霍夫变换(Hough transform):是图像中检测直线的一种方法,也可以检测其他参数化的物体,比如圆或者椭圆等。二、基于特定理论的方法:Mean S原创 2021-06-09 20:21:20 · 611 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —底层视觉—特征点提取、描述与匹配
一、二维图像变换图像变换:值域(亮度、对比度)、自变量域(几何:缩放、平移、旋转)什么类型的变换能表示为2×2矩阵(线性变换)?尺度缩放、旋转 可以。平移不能写成2×2矩阵。为了能写,引入了齐次坐标系。仿射变换 = 线性变化 + 平移:单应变换/射影变换(Projective Transformations) = 仿射变换 + Projective warps 射影空间扭曲:二维变换的总结:欧式变换、相似变换、仿射变换、单应变换二、SIFT特征点检测原创 2021-06-09 16:13:07 · 913 阅读 · 0 评论 -
OCR文字识别项目(原理)
参考视频:OCR文字识别原理OCR光学字符识别:提取图像中的文字,并转换为文本形式,供后续NLP使用。一、CTPN算法:文字检测二、CRNN算法:文字识别池化此时为1×2。才能把特征变为适用于输入到RNN中。...原创 2021-05-27 10:44:50 · 2523 阅读 · 1 评论 -
文字识别(输入为自然场景中的图像)
大老板给我定的方向是文字识别。所以在回所之前先把基础知识看一下,相当于综述~我的方向与目前的文字识别区别在于,目前的文字识别输入主要是自然场景中的图像,从图像进行文字检测再继而文字识别;而我要做的输入是通过手写笔在特殊笔记本上书写后采集到的坐标点。但是还是先从目前的文字识别入手吧~在这个过程中目的有两个。首先是了解文字识别的步骤与经典算法,其次是学会使用深度学习框架。参考文献:OCR文字识别用的是什么算法?文字识别方法整理一文读懂CRNN+CTC文字识别场景文字检测—CTPN原理与..原创 2021-05-25 16:14:26 · 1531 阅读 · 11 评论 -
OCR文字识别—文本识别的算法
一、CTC二、基于Attention机制原创 2021-05-25 14:52:23 · 475 阅读 · 0 评论 -
OCR文字识别—文本检测的算法
一、文字识别:通用目标检测(一阶段、两阶段)二、Faster R-CNN这个是通用目标检测的典型算法。框架分为四大部分:三、CTPN:两阶段的文本检测原创 2021-05-25 14:31:09 · 3972 阅读 · 0 评论 -
OCR文字识别(初识)
一、OCR的概念OCR(Optical Character Recognition):定位与识别图片中的所有文字信息,返回文字框位置与文字内容。即对文本资料和图像文件进行分析识别处理,获取文字及版面信息的过程。二、OCR的技术发展1. OCR传统的解决方案2. OCR前沿的解决方案:文字检测、文字识别文字检测:通用目标检测文字识别:三、OCR的应用...原创 2021-05-24 22:07:00 · 665 阅读 · 0 评论 -
国科大人工智能学院《计算机视觉》课 —底层视觉—深度学习与卷积神经网络、图像底层特征提取
提纲:深度学习与卷积神经网络图像底层特征提取一、深度学习的发展历史要理清楚老师讲的这块的“来龙去脉”,是层层递进的。人工神经网络:多输入单输出、兴奋性神经元和抑制性神经元、阈值生物神经元 —> MP模型感知机的本质是MP模型。浅层学习:单层感知机深度学习:多层感知机(单隐层感知机、双隐层感知机)BP算法:误差逆传播。sigmoid函数梯度消失—> 无监督预训练初始化+有监督的微调ReLU激活函数二、深度学习的常用模型CNN理解卷原创 2021-03-16 17:11:50 · 1313 阅读 · 1 评论 -
图像处理与计算机视觉 第一节课 课堂笔记
2.5维:不是真3维(立体),是在平面中有距离、深度等信息。3维:立体空间中,坐标点都知道。灰度图像:矩阵。但不是所有的矩阵都是图像。因为有很多噪音。灰度图像:一个矩阵。彩色图像:三个矩阵合在一起。RGB。颜色空间:HSV:色调(H),饱和度(S),明度(V);Hue, Saturation, ValueRGB:HSL...原创 2021-03-10 16:24:04 · 218 阅读 · 0 评论