【零基础新手入门CV】(2.数学基础)

这篇简介学习人工智能所需要的基本数学知识


前言

一、数学基础

1.向量

既有大小也有方向。

2.线性变换

加法不变性:T(v+w) = T(v)+T(w)
乘法不变性:T(cv) = cT(v)

3.矩阵

1)矩阵加法:条件:两个矩阵行数、列数相同 加法交换律:A+B=B+A
2)矩阵乘法:条件:A的列数等于B的行数 AB != BA
3)单位矩阵:从左上到右下对角线上都是1,其余元素都为0
4)逆矩阵:A^-1 = A* /|A|
5)奇异矩阵:条件:矩阵的行列式等于0
6)矩阵的转置:行列互换
7)对称矩阵:ATA = AAT

4.欧式变换

两个坐标系之间的变换
A‘ = Ra + t R:旋转、t:平移

5.齐次坐标:用N+1维来代表N维坐标

X = x/w Y = y/w
将(x,y) -->(x,y,w) 通常w=1

6.导数、偏导数

导数:
偏导数:查看某个变量在其他因素不变的情况下对函数的影响程度

7.梯度:

1)表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度方向)变化最快、变化率最大
操作:堆多元函数的各个自变量求偏导数,并把求得的这些偏导数写成向量形式,即为梯度。
2)梯度下降法
在已知参数当前值的情况下,按当前点对应的梯度向量的反方向,并按事先给定好的步长大小,对参数进行调整。
存在问题:参数调整缓慢、收敛于局部最小值

8.概率学基础

1)古典概率:实验结果只有有限个,并且每个结果发生的可能性相同
2)独立型:设A、B为随机事件,若同时发生的概率等于各自发生的概率的乘积,则A、B相互独立。
3)期望方差标准差
数学期望:表示一件事平均发生的概率
方差:用来刻画随机变量x和数学期望之间的偏离程度
标准差:方差的算术平方根
4)正态分布
数学期望为μ,方差为a^2的正态分布,μ=0,a=1是正态分布
数学期望影响图像的中心位置,标准差决定了图像的幅度。

9.熵:信息的混乱程度,系统越混乱,熵越大。

不确定性越大,信息量就越大,熵越大。当某件事情的所有可能结果发生概率相同时,熵值最大。

二、数字图像

1.图像

1).像素:是分辨率的单位,像素是构成图像最基本的单元,每个像素有自己的颜色。
2).分辨率:
图像分辨率:每一个长度方向上的像素个数乘每一个宽度方向上的像素个数的形式表示,就叫做图片的分辨率。也可以表示为单位英寸内的像素点数,是密度单位,单位是PPI.
PPI:单位度量:像素/英寸(就是个单位)。

2.RGB模型

1).光学三元素:红绿蓝
2).在RGB模型的主对角线上,各原色的量相等,产生由暗到亮的白色,即为灰度。
3).RGB转Gray:Gray = R0.3 + G0.59 + B*0.11
4).RGB值转为[0,1]浮点数:灰度值/255(整数运算丢弃小数部分可能导致其颜色失真)
5).OpenCv对读入的图片排列通道是BGR
当想转化为RGB时,可以采用代码
img4 = cv2.imread(‘1.jpg’)
img4 = cv2.cvtColor(img4,cv2.COLOR_BGR2RGB)

3.图像

1).灰度:表示图像像素明暗程度的数值,也就是黑白图像中点的颜色深度,范围一般为:0-255,白色为255,黑色为0。
2).通道:把图像分解为一个或者多个颜色成分。
单通道:一个像素点只由一个数值表示,只能表示灰度(二值图&灰度图)
三通道:RGB模式,把图像分为红绿蓝三通道,可以表示彩色。
四通道:RGBA模式,在RGB基础上增加一个alpha通道,表示透明度,alpha=0表示全透明。
3).对比度:不同颜色之间的差别。 对比度=最大灰度值/最小灰度值
4).频率:灰度值变化剧烈程度的指标,是灰度在平面空间上的梯度。
5).幅值:在一个周期内交流电瞬时出现的最大绝对值,波峰到波谷距离的一半。

4.数字图像

1).定义:计算机保存的图像是由一个个像素点组成,称为数字图像。
2).取样:数字化坐标值称之为取样(采样),采样间隔越大,所得图像像素越少,分辨率低。
3).量化:数字化幅值称之为量化,量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好。

5.上采样和下采样

1).上采样:又称放大图像、图像插值:主要目的是放大原图像,从而可以在更高分辨率的设备上显示。
2).下采样:又称降采样、缩小图像:主要目的①:使得图像符合显示区域的大小②:生成对应图像的缩略图。

6.上采样常用方法

1).最近邻插值
①:在上采样时,将空隙处的像素点的像素值取邻近像素值进行填充。

2).双线性插值
①:对于一个通道:在x方向做两次插值,在y方向做一次插值。
②:存在问题:原图像与目标图像像素对应不上,产生失真问题。
解决方法:使原图像和目标图像的几何中心重合,并且目标图像的每个像素之间都是等间隔的,都和两边有一定的距离。
推导过程手写。
③:优点:灰度较为连续,图像更加光滑。
缺点:比最近邻插值法复杂,计算量较大。

总结

人工智能CV算法入门第二篇,CV算法八股文,欢迎交流QQ:1395362556

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值