我自己的计算机视觉知识结构

实践环境

OpenCV 3.2和Python 2.7

TensorFlow1.1和Python 3.5

-------------------------------------------------------------------------------

计算机视觉框架

语义感知

分类

物体,属性,场景等

检测

物体,行人,人脸等

识别

物体:车牌文本;人:人脸,指纹,虹膜,步态,行为

分割

场景的分割:自动驾驶;检测:光学图像的特征识别

检索

以文搜图,以图搜图,图文连搜

语言

图片描述,图片问答

几何属性

3D建模

双目视觉

增强现实

------------------------------------------------------------------------------

传统图像处理

空域分析和变换(sobel, laplace, 高斯,中值 )

频域分析和变换(傅里叶变换,小波变换)

模板匹配,图像金字塔, 滤波器组

特征数据操作(主成分分析,奇异值分解,聚类)


图像特征

颜色特征:RGB,HSV,Lab等 直方图

几何特征:Edge,Corner,Blob等

局部特征:SIFT,SURF,FAST等

梯度Prewitt滤波/卷积

水平梯度/垂直边缘

垂直梯度/水平边缘

梯度sobel滤波、卷积

梯度laplace滤波、卷积

二阶微分算子

团块检测:周边高于(低于)中心点

边缘检测:像素快速变化的区域

高斯金字塔

多次高斯卷积以后,一些像素多余

n次(高斯卷积->2x采样)->n层金字塔

目的:捕捉不同尺寸的物体(合适尺寸永远未知)

拉普拉斯金字塔

高频细节信息在卷积核下采样中丢失。

保留所有层所丢失的高频信息,用于图像恢复。


模板匹配

兴趣点匹配

Harris角点(corner),任何方向移动小的观察窗,导致像素大的变化。

Blob斑点,一阶导极值点->二阶导零点/对噪声很敏感,需要先做高斯平滑

SIFT,良好不变性,独特性好,信息量丰富,少量图片能产生大量SIFT特征

HOG,纹理特征,分别计算水平,垂直梯度,彩色图选取梯度幅值最大

Gabor:类似人的视觉系统,多频率,多尺度,多方向

频域:属于加窗的傅里叶变换

空域:一个高斯核函数和正弦平面波乘积

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值