算法工程师5——计算机视觉知识点概览

1 基础

1.1 计算机视觉定义

在这里插入图片描述
计算机视觉大部分内容运用了人工智能技术,同样人工智能的发展离不开计算机视觉。计算机视觉是人工智能领域最成功的方向。

1.2 人眼图像的形成

在这里插入图片描述
在这里插入图片描述
图像数字化包括两种处理过程:采样和量化
采样:将空间上连续的图像变换成离散点
量化就是用不同等级的颜色表示图像信息
在这里插入图片描述

1.3 灰度级

在这里插入图片描述

1.4 分辨率

在这里插入图片描述

1.5 数字图像的表示

在这里插入图片描述
图像中每个采样点称为像素,可以用坐标(x,y)表示,像素的数据维度称为通道。
黑白图就是0和1 的二值图
灰度图中0表示最暗,255表示最亮
彩色图像中每个像素点有3个维度,分表表示红绿蓝三个颜色的亮度大小
颜色空间hsv,彩色图像的另一种表示,比rgb表示的颜色更多。

在这里插入图片描述
彩色图像还有其它的颜色表示,不同颜色表示之间可以使用颜色进行转换。

1.6 像素关系

在这里插入图片描述
在这里插入图片描述
像素连同就是在4领域或8领域中有像素相等的点就可连接起来
在这里插入图片描述

1.7 图像中常用的距离有3个

1.欧氏距离
2.城市街区距离
3.棋盘距离

1:欧氏距离是最直观的距离,
在这里插入图片描述

2.城市街区距离(也叫曼哈顿距离):D=|x1-x2|+|y1-y2|;
就是两个直角边的和

3.棋盘距离:D=MAX{|x1-x2|,|y1-y2|}
就是长宽中最小的那个边

1.8 图像计算

在这里插入图片描述

1.8.1 像素计算

在这里插入图片描述
在这里插入图片描述

1.8.2 坐标计算

1.9 色彩3要素

搞不懂,下面是解释,但是还是搞不懂

https://zhidao.baidu.com/question/48787087.html

2 图像预处理

就是图像输入,输出还是图像,一般这样称呼
在这里插入图片描述
在这里插入图片描述

2.1 灰度变换

在这里插入图片描述

2.1.1 对比度增强

在这里插入图片描述

2.1.2 对比度压缩

在这里插入图片描述

2.1.3 伽马矫正

亮的越亮
在这里插入图片描述

2.1.4 直方图变换

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
不是绝对的均衡,是相对均衡一些

在这里插入图片描述
在这里插入图片描述
规定化就是对特定区间进行变换

2.2 空间滤波

就跟卷积原理是一样的
在这里插入图片描述
在这里插入图片描述

2.2.1 均值滤波

在这里插入图片描述

2.2.2 高斯滤波

根据高斯分布来设置滤波器
在这里插入图片描述

2.2.3 中值滤波

在这里插入图片描述

2.3 图像锐化

在这里插入图片描述

2.3.1 边缘检测

在这里插入图片描述

2.3.2 图像锐化实现

在这里插入图片描述

2.4 坐标变换

在这里插入图片描述

2.4.1 平移

在这里插入图片描述

2.4.2 镜像

在这里插入图片描述

2.4.3 旋转

在这里插入图片描述

在这里插入图片描述

2.4.4 缩放

在这里插入图片描述
在这里插入图片描述

2.4.5 仿射变换

在这里插入图片描述
在这里插入图片描述

2.4.6 透视变换

在这里插入图片描述
在这里插入图片描述

2.5 彩色图像处理的两种思路

在这里插入图片描述

2.6 图像预处理技术在深度学习中的应用

在这里插入图片描述
在这里插入图片描述

3 图像处理的基本任务

在这里插入图片描述

3.1 3个等级

3.1.1 图像处理

在这里插入图片描述

3.1.2 图像分析

在这里插入图片描述

3.1.3 图像理解

在这里插入图片描述

3.2 4个基本任务

在这里插入图片描述
在这里插入图片描述

3.2.1 分类

3.2.2 检测

3.2.3 分割

在这里插入图片描述

3.2.4 跟踪

在这里插入图片描述

4 特征提取和传统的图像处理算法

4.1 传统图像处理算法流程

在这里插入图片描述

4.2 图像特征提取

在这里插入图片描述

4.2.1 图像二值化

在这里插入图片描述
关键在于阈值的设置

在这里插入图片描述

4.2.2 形态学处理

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.2.3 模板匹配

给一个模板,匹配出相似的部分
在这里插入图片描述
模板匹配用到了滑动窗口法,来回滑动

4.2.4 特征描述子

在这里插入图片描述

4.2.5 方向梯度直方图HOG

参考下面网址,将的比较清楚
https://blog.csdn.net/passball/article/details/82254256
在这里插入图片描述

4.2.6 局部二值模式LBP

在这里插入图片描述

4.2.7 Haar特征提取描述子

在这里插入图片描述

在这里插入图片描述

4.2.8 灰度共生矩阵GLDM

参考下面资料:
https://blog.csdn.net/qq_37059483/article/details/78292869

https://blog.csdn.net/guanyuqiu/article/details/53117507

5 深度学习

在这里插入图片描述

图像处理总结

(1)读取,保存
(2)显示为数字
(3)颜色变换
(4)图像缩放
(5)图像裁剪
(6)图像位置变化,翻转等
(7)多幅图像加减乘除等
(8)灰度变换
(9)重采样,分辨率变换
(10)滤波变换
(11)图像锐化
(12)二值化
(13)腐蚀,膨胀
(14)模板匹配
(15)hog
(16)LBP
(17)Haar

在这里插入图片描述

6 计算机视觉的研究领域和主要公司

6.1 8大公司

在这里插入图片描述

6.2 计算机视觉的9大应用领域与任务:

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

6.3 要会的研究方向

3大技术和4大方向:

6.3.1 三大技术

  1. 图像分类
  2. 目标检测
  3. 语义分割

6.3.2 4大研究方向

  1. 人脸识别
  2. OCR文字识别
  3. 遥感影像语义分割
  4. 工业上的缺陷检测(车道线检测,行人检测,缺陷检测)

6.3.3 三大顶会

在这里插入图片描述

参考资料

[1] https://www.bilibili.com/video/BV1Yt4y1i7by?p=25&t=185
[2] 计算机视觉哪个方向就业比较好? - 知乎
https://www.zhihu.com/question/319883236

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
很高兴为您解答问题。首先,需要明确的是“认真智能导论”这个概念比较模糊,不确定您指的是哪本书或者是哪个课程。因此,在回答您的问题时,我将从智能导论这个领域的知识点出发,为您呈现一个智能导论知识图谱的概览。 智能导论是一门跨学科的学科,涉及到计算机科学、统计学、认知科学、心理学、哲学等多个领域。知识图谱是一种图形化的展示方式,可以将知识点以图谱的形式展示出来,方便用户查看和理解。 以下是智能导论知识图谱的一些主要知识点: - 人工智能的历史发展:从图灵测试到深度学习的发展历程,介绍人工智能从概念到技术的演进。 - 机器学习的基础知识:监督学习、无监督学习、强化学习等机器学习的基本概念和算法。 - 神经网络:介绍神经元、神经网络的基本结构和常见的神经网络模型,如卷积神经网络、循环神经网络等。 - 自然语言处理:介绍自然语言处理的基本任务,如分词、词性标注、句法分析、语义分析等,以及常用的自然语言处理技术。 - 人工智能的伦理和社会影响:探讨人工智能在社会、政治、经济、伦理等方面的影响和应对措施。 除了以上几个主要知识点,智能导论还涉及到很多具体的技术和应用,如计算机视觉、机器人技术、智能推荐等等。通过知识图谱的形式,我们可以清晰地了解这些知识点之间的关系和联系,更好地理解智能导论这门跨学科的学科。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

晓码bigdata

如果文章给您带来帮助,感谢打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值