将彩色图像和纯图像 PDF 的大小减小 90%
图像分割是将图像的像素划分为不同类的过程,每个类都具有相干特征。这些特征可以是颜色、纹理和强度。在文档数字化领域,图像分割通常用于将图像划分为文本块、艺术线条图形、图像和背景(纹理、光线不足的阴影等)。
点击下载Dynamsoft最新版https://www.evget.com/product/3691/download
什么是 MRC?
MRC 代表混合光栅内容,是图像分割的一种应用。 MRC 是一种压缩包含二进制可压缩文本和连续色调分量的图像的方法。
文档图像可以用不同的层表示:
- 第一层是前景层,它存储文本块和线条图形的颜色。
- 第二层是没有颜色信息的文本块和线条图形。
- 第三层是背景和图像,通常占图像大小的大部分。
根据压缩特性,可以对每一层应用不同的压缩算法,从而在不降低视觉质量的情况下获得高达 10 的最佳压缩比。
- JBIG2 是一种用于压缩文本块和图形的高效算法。
- 对于背景和彩色图像,JPEG 和 JPEG 2000 可以实现相当水平的压缩,而不会损失颜色的平滑度和准确性。
这三个层以及如何将它们重新组装和渲染到一个文件中的说明都存储在一个文件中。
支持 MRC 压缩的文件格式
PDF 是支持 MRC 压缩的最常见的文件格式。
MRC 3 层模型还以其他数字文档格式实现,包括 .tfx (TIFF-FX)、.ldx (LuraDocument) 和 .djvu (DjVu)。
MRC 压缩的好处
MRC 压缩最初是为了压缩扫描的彩色页面/图像以进行传真传输而开发的。如今,该方法也用于文档扫描的图像和相机的快照。
混合光栅内容压缩的主要好处是显而易见的 - 较小的尺寸。这减少了传输中的带宽,从而加快了文件传输速度。此外,较小的文件大小会导致数据库中的存储空间减少。
MRC 方法也有一些有益的副作用:
- 文字更清晰。通过将文本图层与前景和背景分开,可以锐化文本以使其更易于阅读。
- 清理后的背景。三层分割的做法也有助于清理背景。背景上的纹理和阴影可能会分散读者的注意力。去除阴影或柔化纹理可以改善阅读体验。
MRC 提高 OCR 准确性
根据上面的讨论,我们可以理解混合光栅内容压缩会产生干净且独立的文本块。这提高了下游 OCR 的准确性。通过 OCR 将图像 PDF 转换为可搜索的 PDF,员工效率进一步提高。
咨询了解 Dynamic Web TWAIN 的 MRC 压缩功能
其他热门条码工具推荐
Dynamsoft Barcode Reader 是一个全面的条码扫描和解码解决方案,凭借其强大的条形码检测算法、摄像头增强功能和 OCR 功能,可以帮助快速检索复杂视频条码。
Aspose.BarCode 是一款专业的条码开发控件,可在任何平台上生成和识别条形码,特别是开发嵌入食品管理系统中的条码功能开发。
BarTender作为一款企业级的条码工具, 既可以单独运行,也可以与任何其他程序集成,可以帮助食品打印标签、包装打标、智能证卡编码、标牌制作等。
除了上述工具之外,也有很多功能不错,性价比也很高的条码工具可供选择,例如TBarCode SDK/Barcode Studio/Softek等,用户可根据需求选择,