文档图像二值化DIB-图像质量评价指标

最新推荐文章于 2024-07-16 15:12:22 发布

yddcs

最新推荐文章于 2024-07-16 15:12:22 发布

阅读量1k

点赞数 2

分类专栏： # 文档图像二值化文章标签：机器学习 python 数据分析深度学习人工智能

本文链接：https://blog.csdn.net/qq_35200351/article/details/116133920

版权

文档图像二值化专栏收录该内容

4 篇文章 3 订阅

订阅专栏

文档图像二值化DIB-图像质量评价指标

文档图像增强和二值化方法通常用于提高文档图像分析任务（如文本识别）的准确性和效率。传统的非机器学习方法以无人监督的方式构建在低级特征上，但难以在具有严重降级的背景上的文件上的二值化。基于卷积神经网络（CNN）的方法仅关注灰度图像和局部文本特征。本文介绍一些图像质量评价指标。

找paper搭配 Sci-Hub 食用更佳 (๑•̀ㅂ•́)و✧
Sci-Hub 实时更新 : https://tool.yovisun.com/scihub/
公益科研通文献求助：https://www.ablesci.com/

参考文献 : Submitted to IEEE Transactions on Image Processing

文档图像二值化DIB系列 paper -1-， paper -2-，database

图像相似度衡量指标

1. MSE, SNP, PSNR

对于任意的 $x$ 和 $y$ 的值，真实图像 $f (x, y)$ ，模型生成的二值图像 $g (x, y)$ ，则误差 $e (x, y) = g (x, y) - f (x, y)$ 。
因此，两幅图像的总误差 $E$ 为 $M \times N$ 个 $e^i$ 相加。
$E={\sum_{x=0}^{M-1} \sum_{y=0}^{N-1} [g(x,y)-f(x,y)]}$
图像大小为 $M \times N$ ，均方误差 $M S E$ 是在 $M \times N$ 阵列上的平均误差。
$MSE=\frac {\sum_{x=0}^{M-1} \sum_{y=0}^{N-1} [g(x,y)-f(x,y)]^2}{M×N}$
信噪比 $S N R ，单位： d B :$
$SNR=\frac {\sum_{x=0}^{M-1} \sum_{y=0}^{N-1} g(x,y)^2} {\sum_{x=0}^{M-1} \sum_{y=0}^{N-1} [g(x,y)-f(x,y)]^2}$
峰值信噪比 $P S N R ， P e a k S i g n a l t o N o i s e R a t i o :$
$PSNR=\frac {\sum_{x=0}^{M-1} \sum_{y=0}^{N-1} Max^,g(x,y)^2 /MN} {\sum_{x=0}^{M-1} \sum_{y=0}^{N-1} [g(x,y)-f(x,y)]^2 /MN} =\frac {{MaxValue} ^2} {MSE}$
计算时使用：
$PSNR=10\log_{10} {\frac {{MaxValue} ^2} {MSE}}=10\log_{10} \frac {255^2} {MSE}$

  def cal_psnr(im1, im2):
      mse = (np.abs(im1 - im2) ** 2).mean()
      psnr = 10 * np.log10(255 * 255 / mse)
      return psnr

对于 $f l o a t$ 型的图像数据，其取值范围是 $[0, 1]$ ，设置 $M a x V a l u e$ 为 $1$ 。对于 $u i n t 8$ 类型的图像数据，其取值范围是 $[0, 255]$ ，设置 $M a x V a l u e$ 为 $255$ 。 $P S N R$ 越大越好。

2. SSIM

结构相似度指数 $S t r u c t u r a l S i m i l a r i t y$ ，是一种衡量两幅图像相似度的指标。从图像组成的角度将结构信息定义为独立于亮度、对比度的反映场景中物体结构的属性，并将失真建模为亮度、对比度和结构三个不同因素的组合。用均值作为亮度的估计，标准差作为对比度的估计，协方差作为结构相似程度的度量。结构相似性的范围为 $[- 1, 1]$ 。当两张图像一模一样时， $S S I M$ 的值等于 $1$ 。
在这里插入图片描述
其中 $\mu_x$ 是 $x$ 的平均值， $\mu_y$ 是 $y$ 的平均值， $\sigma_y^2$ 是 $y$ 的方差， $\sigma_x ^2$ 是 $x$ 的方差， $\sigma_{xy}$ 是 $x$ 和 $y$ 的协方差。 $C_1=(k_1L)^2$ ， $C_2=(k_2L)^2$ 是用来维持稳定的常数。 $L$ 是像素值的动态范围。 $k_1=0.01$ , $k_2=0.03$ 。

  def cal_ssim(im1, im2):
      assert len(im1.shape) == 2 and len(im2.shape) == 2
      assert im1.shape == im2.shape
      mu1 = im1.mean()
      mu2 = im2.mean()
      sigma1 = np.sqrt(((im1 - mu1) ** 2).mean())
      sigma2 = np.sqrt(((im2 - mu2) ** 2).mean())
      sigma12 = ((im1 - mu1) * (im2 - mu2)).mean()
      k1, k2, L = 0.01, 0.03, 255
      C1 = (k1*L) ** 2
      C2 = (k2*L) ** 2
      C3 = C2/2
      l12 = (2*mu1*mu2 + C1)/(mu1 ** 2 + mu2 ** 2 + C1)
      c12 = (2*sigma1*sigma2 + C2)/(sigma1 ** 2 + sigma2 ** 2 + C2)
      s12 = (sigma12 + C3)/(sigma1*sigma2 + C3)
      ssim = l12 * c12 * s12
      return ssim

$图像二值化模型评估指标：$

$F M ， p - F M ， P S N R ， S S I M ， D R D ， M P M ， N R M$

3. FM，p-FM

$F - M e a s u r e :$
在这里插入图片描述
$R e c a l l ， P r e c i s i o n$ 为分类中的性能指标。

$p s e u d o F - M e a s u r e :$
在这里插入图片描述
$p R e c a l l$ 定义为 $g r o u n d$ $t r u t h$ 图片的镂空百分比。

4. DRD

$D i s t a n c e R e c i p r o c a l D i s t o r t i o n M e t r i c :$
在这里插入图片描述
$D R D$ 用于衡量二值化文档图像中的视觉失真。

5. MPM，NRM

$M i s c l a s s i f i c a t i o n P e n a l t y M e t r i c :$
$MPM=\frac{MP_{FN}+MP_{FP}} {2}$

$w h e r e$ $MP_{FN}=\frac{{\sum_i}d_{FN}^i}{D},MP_{FP}=\frac{{\sum_j}d_{FP}^j}{D}$
$d_{FN}^i$ 和 $d_{FP}^j$ 表示 $G T$ 图像中第 $i$ 个假阴性和第 $j$ 个假阳性像素距离文本轮廓的距离。归一化因子 $D$ 是 $G T$ 对象的所有像素到轮廓距离之和。 $M P M$ 越小越好。

$N e g a t i v e R a t e M e t r i c :$
$NRM=\frac{NR_{FN}+NR_{FP}} {2}$
$w h e r e$ $NR_{FN}=\frac{FN}{FN+TP},NR_{FP}=\frac{FP}{FP+TN}$
$N R M$ 衡量 $G T$ 与预测图像之间的不匹配程度。

yddcs

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
文档图像二值化DIB-图像质量评价指标

文档图像二值化DIB-图像质量评价指标1. MSE, SNP, PSNR2. SSIM3. DRD4. FM，p-FM5. MPM，NRM图像相似度衡量指标1. MSE, SNP, PSNR 结构相似度指数 ssim Distance Reciprocal Distortion Metric对于任意的x和y的值，真实图像f(x,y))，模型生成的二值图像g(x,y)，则误差e(x,y)=g(x,y)−f(x,y)。因此，两幅图像的总误差E为M×N个ei
复制链接

扫一扫