mfcc总结,对比直方图均衡化(一)

在人脸识别中(opencv),隐藏了一个不起眼的函数,叫做直方图均衡化。搞定mfcc之后,有一天早晨起床,突然发现mfcc神似直方图均衡化,又打开吃灰的概率论和图像处理,反复研究,迈上一个台阶,终于懂了直方图均衡化。今天我们先搞定直方图均衡化,你可以看一看,mfcc是如何神似藏其中的。

翻开概率论,问,已知ε的概率密度函数是φε(x),η=4*ε-1,求η的概率密度函数φη(x)。求解如下

Fη(x)=P{η<=x}=P{4*ε-1<=x}=P{ε<=(x+1)/4}=Fε((x+1)/4),

然后两边对分布函数对x求导:

φη(x)=φε((x+1)/4)*d((x+1)/4)/dx

φη(x)=φε((x+1)/4)*1/4

这给出了这个概率密度函数间的转化公式:φη=φε*dε/dη,

好难看,变一下φy=φx*(dx/dy),是否好看多了,但不影响实质。

好,我们玩一玩概率论,有没有一个函数y=f(x)能保证:

0<=x<=255,0<=y<=255

这就是概率论的好处了:你看离散型概率密度函数的基本性质

1,Pk>=0;k=1,2.....(这里我们的上限让他等于256)

2,\sum \binom{k=256}{k=1}Pk=1

令x=k-1;则0<=x=k-1<=255,0<=y=255*\sum \binom{x<=255}{x=0}Px<=255

所以y=f(x)=255*\sum \binom{x<=255}{x=0}Px,其实我们也不知道这个东东能干啥。

当一幅有人脸的图像偏暗(灰度【0,255】图像)看不清,我们统计了他的直方图Px=H(x)/(图像的高*宽),好,我们把这个Px带入上面那个东东y=f(x)=255*\sum \binom{x<=255}{x=0}Px,耍了一把,即图像中每一个像素的灰度等于x时,我们用计算出来的y值替代x(一种映射),我的个乖乖,人脸清晰的出现了。

我的神啊,这个概率论太伟大了吧(化腐朽为神奇)!

我想\sum \binom{k=256}{k=1}Pk=1归一化的第一好处,便是概率论的产生。

对比mfcc,你有没发现猫腻?下一节,我们做一对比。

 

注释一:在上面的例子中,要注意,转换函数η=4*ε-1是不满足直方图均衡条件要求的。

满足直方图均衡条件的转换函数是:y=f(x)=(n-1)*\sum \binom{x<=n-1}{x=0}Px;(0<=x<=n-1,一般情况,在图像处理中n=256)

在图像处理中,为了保证原图像通过一个逻辑后,发生了变化,为了保证变化的可逆性,就会增加苛刻的条件加以限制,这是逻辑的伟大之处,也是科学的伟大之处,而我们的时光却是单向性的,好,扯远了,直方图均衡化可逆的条件是,严格的单调递增函数。但,有时,我们不需要返回。有清晰的人脸,已经解决问题了。

注释二:你有没有发现,我们求的公式φy=φx*(dx/dy),好像没用过,好,现在来用以下,y=f(x)求导,

dy/dx=d(255*\sum \binom{x<=255}{x=0}Px)dx=255*Px;因为φx=Px;所以φy=Px*(dx/dy)=Px*1/(255*Px)=1/255.

这个概率密度函数φy=1/255是什么意思?记得一个麻将骰子每个面数字的概率都是1/6吗?这个叫离散型均匀分布

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值