深度学习图像处理基础

分辨率

是什么

在这里插入图片描述
一张照片被拍摄出来之后,我们将其放大,可以看多许多的小方块单元,这些单元称为像素,组成了整个照片,而分辨率就是水平像素个数和垂直像素个数组合而成

在这里插入图片描述
上图相机的最高像素可以达到三千万,像素越高成像越清晰

视网膜屏

视网膜屏

在这里插入图片描述
视网膜屏就是像素颗粒很小,很细腻,细腻到人眼看不出来像素颗粒的存在,就被称为视网膜屏

视网膜屏的设计,可以欺骗人类的大脑,将一些零散的画面,反馈到大脑后成为连续的画面,这是视网膜屏的重大意义

人眼的视觉

视力

在这里插入图片描述
视力是你将两条线看成一条线之后,人眼与两条线形成的夹角,就是视力吗,这个角被称为极限分辨角度
在这里插入图片描述
在这里插入图片描述

当我们使用E子表,测试视力时,上面所反馈得到的数值,是极限分辨角度的倒数,单位是角分

像素密度

在这里插入图片描述
我们通常使用像素密度来判断像素的大小,像素密度是对角线的像素个数/对角线尺寸(单位英寸),得出这块屏幕的像素密度,简称PPI

设置合适的PPI,制造视网膜屏

在这里插入图片描述
想要计算出一个视网膜屏的PPI,需要得知这个人的视力以及观看距离,视力与观看距离可以计算出视野范围,也就是尺寸,拿到尺寸之后,根据人眼能分辨的最小的像素单元大小,就可以计算出像素的密度,即PPI

色彩

是什么

在这里插入图片描述
在这里插入图片描述
颜色是光反射的结果,光的本质是电磁波,而人类能够捕捉到的光的频率范围是400nm至700nm

色匹配实验

在这里插入图片描述
根据色匹配实验得出,同一种颜色,可以由完全不同的光谱分布实现
在这里插入图片描述
且,任何一种颜色,都可以使用红绿蓝三原色不同的比例分配进行合成

色彩匹配的意义

在这里插入图片描述
由以上结论可知,我们想要显示一个颜色,无需真的把那个颜色调出来,而是用三原色红绿蓝调制特定的比例从而合成我们想要的颜色,从而用更少的资源更高效的做事

量化色彩匹配

白色合为1

在这里插入图片描述
我们规定三原色等比例合成白色时,三色和为1

色度图

在这里插入图片描述
将400nm至700nm的点画在上面的图中,会显示出独特的曲线,而从中取三个点形成三角形,那么该三角形内的色彩就可以由这三个点的不同比例匹配出来,所以三角形越大,匹配的色彩越多
但是从工业的角度出发,为了成本,我们只需要一个能将我们日常生活中较为常见的色彩匹配出来的三角形即可,所以出现了许多的三角形标准,如下图
在这里插入图片描述

总结

在这里插入图片描述

HDR

光亮度(尼特)

人对亮度的差异的分辨能力存在极限

灰阶

在这里插入图片描述
一个器件亮度从最暗到最亮被划分为有限个等级,这些等级称为灰阶
而这些有限个灰阶的划分是按照二进制的位数划分的
例如一个8bit的灰阶,有2的8次方个不同的等级,且等级变化不连续,是间断变化的,8bit就是用二进制表示就是100000000,转为十进制就是2的8次方,计算结果为256
在这里插入图片描述
但是由于人眼对亮度差异的分辨存在极限,所以,对于不连续的灰阶,在人眼看来,是连续的

亮度范围

在这里插入图片描述
人眼能感知的亮度范围是10的-6次方到10的8次方,但是目前所有的感光器件(例如相机),他的亮度范围都没能达成人眼的范围,都要比人眼的范围小

HDR显示技术

在这里插入图片描述
所以,HDR就是将一个相机拍摄的从最暗到最亮的几张有代表性的照片合成到一起,这就是HDR技术
但是HDR技术有可能会造成原来的亮度差异的变化,造成画面的失真
所以,捕捉到更多的灰阶以及足够大的尼特范围,是HDR努力的方向

总结

在这里插入图片描述

数字图像化

概览

在这里插入图片描述
首先我们得到一张照片
之后,由于相机cmos的限制,我们将其分成3808*2856个像素
之后,根据三原色匹配原理,将其分成三层颜色不同的像素图
最后,根据颜色的比例,将其用8bit的灰阶进行编码量化

人脸检测

需要关注的两个问题

在这里插入图片描述
人脸检测需要关注这两个问题

人脸的判别

人脸检测算法

在这里插入图片描述

第一步

在这里插入图片描述

类哈尔特征

在这里插入图片描述
根据不同区域亮暗的区别,以及区域的大小,可以得到如下图所示的类哈尔特征:
在这里插入图片描述
白色代表亮的区域,黑色代表暗的区域,而大小则代表像素的多少

集成学习

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
如上几图所示,集成学习就是集成一些正确率不高的线索,最终达到目的,而我们要集成的对象就是弱分类器,他之所以叫做弱分类器,是因为他们单独行动时,准确率不高,但是将他们集成起来,就能达到不错的效果

第二步

在这里插入图片描述
在这里插入图片描述
将一些集成分类器时,将分类器进行等级划分,对于一些可以获取到大前提信息的分类器,要放在前面,优先级要高,因为如果大前提不满足,那么更别提细节了
所以,以人脸检测来说,最高级是判断是否是人脸,如果不是,直接排除,无需进行后续运算,可以大大提高效率

第三步

在这里插入图片描述

积分图算法

在这里插入图片描述
积分图中,一个点的亮度等于其与左上角所组成的矩形的亮度之和,那么如果要计算一个矩形的亮度,就是C+A-B-D

人脸的定位

滑动窗口与滑动尺寸

在这里插入图片描述
设置一个滑动窗口以及滑动尺寸,该窗口从上至下从左进行滑动,每次到达停止位置时,进行类哈尔特征级联检测,同时使用亮度积分图进行加速

补充(关于机器学习)

在这里插入图片描述
viola-Jones算法的特征是自己设置的,而参数是机器自己通过样本自己得到的,这一过程称为机器学习
今后还有一种算法,特征和参数都是机器学习得到的,该算法是基于深度学习构建的

深度学习十大应用

分辨率增强

在这里插入图片描述
分辨率增强,是在空间维度,增强画面的细腻度

帧率增强

在这里插入图片描述
帧率增强是在时间维度,增强视频的流畅度

色彩增强

在这里插入图片描述
给一张照片或者视频上色

风格迁移

在这里插入图片描述

图像分类

在这里插入图片描述
根据图像中的内容对图像进行分类

物体检测

在这里插入图片描述
之前的人脸检测的更优算法,就是该项的一个应用

物体分割

在这里插入图片描述
在这里插入图片描述
对物体进行检测时,能够分割出一个物体的轮廓,就是物体分割

特征检测

在这里插入图片描述
一个应用是判断摄像头捕捉到的是不是人脸

人脸识别

在这里插入图片描述
人脸识别要检测这张脸是谁的脸

物体生成

在这里插入图片描述
类似于,无中生有生成一张照片或者视频

神经网络

深度学习,更为详细的翻译是:基于深度神经网络的机器学习,所以,神经网络是深度学习的核心概念
在这里插入图片描述

神经元

工作原理

简介

在这里插入图片描述
神经网络是参考生物中的神经元进行设计的,有若干个输入和一个输出

实例

在这里插入图片描述

在这里插入图片描述
a1 a2 a3在w1 w2 w3的权重下求和,得到的值再经过f函数,会得到结果
在这里插入图片描述
该函数称为激活函数

神经网络

简介

在这里插入图片描述
假设我们有五个神经元,即有五个MP模型,将其分成两组,将第一组的输出连到第二组的输入,就构成了神经网络,神经网络的关键就在于将神经元以层级的方式链接起来
两层的神经网络还有一个别称:感知机

深度神经网络

在这里插入图片描述
两层的神经网络叫做感知机,而两层以上的神经网络,就被称为深度神经网络,他的第一层是输入层,第二层是输出层,中间的所有层,称为隐藏层
感知机只能解决线性问题,而深度神经网络可以解决非线性问题

要注意:
在这里插入图片描述

总结

在这里插入图片描述

  • 19
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值