这一节,我们来总结前面所有的猜测。
我们发现,初中物理透镜成像,是可以成模糊实像的。
这种模糊实像表达了这样的意思,针对清晰图像,模糊图像仍然能识别到清晰图像带来的结果,而且根据几何知识,可以看到这种模糊成像是线性的。
第一,包含自己,第二,线性的,第三,透镜成模糊像在空间上是连续的。我们想到了e^x求导是自己。我们想到了导数。
然后我们更一般的会想到,f(x)'=f(x),但我们说过了,这样的f(x)自己还是自己,求导还是自己,不可能模糊,表达线性线性有限f(x)'/f(x)=1,这种线性是不变的,我们想要的线性是可变的,而且是和x相关的(我们在机器视觉中,都有这样的经验,放大是需要相邻像素插补的,那么图像会变模糊,缩小,会丢失像素,也会变模糊,和x相关,就是和放大缩小倍数相关,他恒等于1怎么行?也就是说,比例放大或缩小,可以达成模糊)。
我们的模糊图像和和函数的导数挂钩,所以我们研究的是f(x)'。
假设,f(x)'是因变量,f(x)是自变量,我们首先要的是,f(x)'正比于f(x)。(包含自己)
第二个想要的是,f(x)'/f(x)正比于x。(包含自己,也表达了线性,而且和自变量x相关,其实代替1的时候,我想到了随便一个变量,比如,a,只要不是1,然后想到a可以等于cx,c是常量)
在恩格斯的自然辩证法中,说动能正比于质量,动能正比于速度的平方,其中写下了这样的动能公式:E=c*m*v^2。
我们可以借鉴过来:f(x)'=c*f(x)*x。
因为f(x)本来是因变量,x是自变量,这样,我们可以看到因果x->f(x)->f(x)'。
这样,我们就把导数,函数,和自变量联系起来了。
而且把线性模糊表达出来了。
我查了一下高数,f(x)'=c*f(x)*x是一阶线性微分方程。
一阶线性微分方程有通解,我们可以求出f(x)=K*exp(0.5*c*x^2)(k是随便一个常量,你也可以写成a,或b呀啥的)。
学过概率论的人都知道,概率密度函数积分等于1,也就是说必然发生的概率等于1。
假定我们没学过概率论,我们为什么要这样做?f(x)dx=1,留给大家思考。
即就是f(x)dx=1,条件是c<0。
因为exp(-x^2)dx=sqrt(PI)。
所以令c=-1/(sigma*sigma),高数中常常这样,为了求导或积分方便,做一些构造,因为c是常量,sigma也一样,也可以写成a呀,b的什么,都可以。
可以求出:k=1/(sqrt(2*PI)*sigma)。
所以,f(x)=K*exp(0.5*c*x^2)=1/(sqrt(2*PI)*sigma)*exp(0.5*-1/(sigma*sigma)*x^2)
其实,我们也不知道,sigma是什么鬼,只是数学推导的方便。
后来人们画出来了这个函数的图形,像口钟,发现了sigma的意义,就是尺度。
我们推出了高斯公式,有什么意义呢?
高斯推出这个公式时并不是为了解决这个问题。
而我们为了解决一个线性模糊的问题,也推出了高斯公式。
那么,你说高斯公式能干什么呢?
不就是又有了新的应用和领域了呗(计算机视觉)!
说穿了,就是高斯函数是图像尺度变换的唯一线性变换核。
需要解释的是(x轴是如何变成尺度轴的):
我们的下图的‘?’主轴可以变成k*sigma,下面表达了k=1和k=2的情形
你可以把这个?轴,想象成透镜成像的光学主轴,想成透镜成像,成真实的模糊实像。
我们上面的推理都是以笛卡尔坐标系假想的,现在我们用透镜光学轴替换,结果是显然的,这就达成了我们的目的。
你还可以想一下,这个透镜不就是相机吗?不就是我们的眼睛吗?
其实我们眼睛判断一物,主要靠的是眼睛的模糊成像,他们说我们的眼睛自带高斯模糊。
网络上常说“细一看,还不如乍一看”,原来美女化妆,也是起高斯模糊(平滑)的作用,清晰成像,只是个别少数需要较真的时候,其实这引出了一个真理:
我们识别一个区域或事物,大多数靠的是高斯函数(正太分布),通俗的解释是,‘大体是’就可以了,这代表了绝大部分概率,而细节和特征是不重要的,他们的概率占很少部分。
讲个笑话,以前近视,在大街上,把别人认成爸爸了!
其实这种情况一辈子能发生几回呢?
我们计算机视觉把特征当成了第一要务,实际这是错误的,方向性的错误,你如果能用学到的高斯函数道理来审视这个问题,所谓的计算机视觉技术,我认为可以再上一层楼。
但谁能一步正确呢?我们都是一步一步摸索过来的。
他们说,细节是成败的关键,是啊!你看到这句话隐含了怎样的条件吗?