数据压缩与三角形网格压缩方法解析
在数据处理和计算机图形学领域,数据压缩是一项重要的技术。它能够减少数据存储空间,提高数据传输效率。本文将介绍两种不同的数据压缩方法:Sequitur 和 Edgebreaker 算法,前者用于半结构化文本数据压缩,后者用于三角形网格的压缩。
1. Sequitur 压缩方法
Sequitur 是一种基于规则的压缩方法,其核心优势在于每个规则都会被使用多次。与一些字典式压缩方法不同,那些方法可能会在字典中添加未来可能不会出现的字符串,从而导致这些字符串永远不会被使用。
1.1 规则建立示例
在 Sequitur 中,规则的建立通过发送特定的对来实现。例如,发送对 (1, 2)(偏移量 1,计数 2),解码器识别该对并建立规则 1 → bc。发送规则 A 的第一份副本相当于发送 abcd(1, 2),第二份副本作为对 (0, 4) 发送,因为 A 在 S 中的偏移量为 0 且长度为 4,解码器识别此对并建立规则 2 → a1d1,最终结果为 abcd(1, 2)(0, 4)。
1.2 适用数据类型
Sequitur 在处理由相邻相同字符串组成的数据时表现最佳。虽然在一般输入流中,相同字符串通常不相邻,但有一种数据类型,即半结构化文本,其中相同字符串往往是相邻的。半结构化文本是指既适合人类阅读又适合机器处理的数据,常见的例子包括 HTML 文件、表单、电子邮件消息和数据库。
- HTML 文件 :由嵌入标记标签的文本组成,标签数量较少且需遵循特定规则,因此标签具有高度结构化,而文本则是非结构化的自由文本,整个 HTML
超级会员免费看
订阅专栏 解锁全文
1986

被折叠的 条评论
为什么被折叠?



