计算机科学投稿方式,计算机科学投稿模板.doc

一种基于模板的档案图像压缩新方法

杨 有1,2 张小小2 王 伟2,3

(重庆师范大学数学与计算机科学学院 重庆 400047)1

(重庆大学计算机科学与工程学院,重庆 400044)2重庆 400067)3

摘 要 在大容量档案图像数据库中,不仅单页档案图像内部存在数据冗余,而且档案图像页之间存在大量集合冗余。本文提出了基于模板的压缩新方法,通过定义相似图像集合的模板,充分利用图像数据的先验知识,对档案图像的内容进行分析和理解,从图像内和图像间以二维模式压缩图像数据。实验表明,该方法能够大幅提高压缩性能。

关键词 档案图像,模板,图像压缩,集合冗余

中图法分类号:TPXXX 文献标识码:A

New Compression Approach to Document Image Based on Template

YANG You1,2 ZHANG Xiao-xiao2 WANG Wei2,3

(School of Mathematics and Computer Science, Chongqing Normal University, Chongqing 400047,China)1

(Department of Computer Science and Engineering, Chongqing University,Chongqing 400044, China)2

(Department of Computer and Modern Education Technology, Chongqing Education College, Chongqing, 400067, China)3

Abstract In super large document image database, data redundancy exists not only in individual image, but also between images. A new compression approach based on template was proposed. Through the definition of template, the approach utilized the image prophetic knowledge sufficiently. After the analysis and understanding of image content, it compressed image from intra-image and inter-image. The experiment showed that the approach could increase compression ratio greatly.

Key words Document image,Template,Image compression,Set redundancy

档案数码化是信息化建设的一项基础工作,而信息化又是覆盖我国现代化建设全局的一项战略举措。基于网络的数字档案图像应用系统必须考虑三个问题:一是从存储空间方面考虑,即档案的大小。一页ASCII码档案只占2~3KB,而一页典型扫描的数字档案需要500kB~2MB,由此可见数字档案压缩的重要性。二是从时间方面考虑,即压缩图像的有效存取。传统压缩减少了存储容量,但没有提供压缩数据的有效存取方法,比如快速传输、压缩域处理和存取等。三是数字档案的可读性,即档案的质量。因此,在遵照《中华人民共和国档案法》和一些相应行规的前提下,对数字档案图像进行压缩就成为这类应用系统的核心问题。

1档案图像压缩技术

档案图像属于静态图像,但它又与诸如遥感和医学等静态图像有所区别,其压缩方法也具有一定的特殊性。在众多的档案图像定义中,公认的观念是:档案图像是具有结构的图像,它包含了许多表征语言符号的元素,且这些元素之间具有明显的冗余性。由此,我们知道,在档案图像中,大多数有用信息在符号级,而不是在像素级或纹理级中,因此纯粹的基于像素级或亚像素级的静态图像编码方法对档案图像是不适用的。同时,由于档案图像具有高对比度、高倾斜度、局部非均匀像素模式等特点,对其采用纹理编码也是不合适的。对于文本富裕档案,由于符号多次重复出现,而且图像具有较高程度的层次结构,所以这类档案的压缩可以采取去除符号级冗余的压缩方法,即PM&S(Pattern Matching and Substitute,模式匹配与替代)技术[1,2]。

在数字档案图像应用系统中,数据压缩不仅要考虑单幅档案图像的编码,而且还要考虑档案图像之间的冗余性,即用图像的集合统计特性来代替单个图像统

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值