压缩级别_日志通用压缩算法的对比研究

这篇博客探讨了通用压缩算法在日志管理中的应用,对比了不同算法在日志数据上的效果,以及文件大小、压缩级别对压缩效率的影响。研究发现,对日志数据,压缩比高的算法如PPMD并不一定是最佳选择,而LZ4在速度和稳定性上表现出色。此外,论文指出理想的块大小在128KB到256KB之间,且高级别的压缩对日志可能并非总是最优,因为消耗资源较多。
摘要由CSDN通过智能技术生成

e7b026861ab5c1ed45698956a3b471ee.png

之前的文章介绍日志领域的研究方向时,曾经提到有些研究关注在日志的压缩方面,毕竟日志实在量太大了!日志易一个规模还可以的股份制银行客户,按照法律要求的存储时长计算磁盘大小,对应的硬件成本就是几千万。

但是这些研究大多有一个问题,那就是它们只考虑如何把日志的存储空间压缩到最小,却并不怎么考虑同时如何继续支撑已有的各种日志管理软件的读写方式——通常来说它们的做法都是自己设计一个索引或者模板提取方式,然后把日志转化过去。

那么,在通用的压缩算法基础上,日志领域还有什么可以研究和发挥的空间么?


前些天看到加拿大女王大学的一篇新论文,解答了这个问题。

A Study of the Performance of General Compressors on Log Files​users.encs.concordia.ca

论文主要调研了三个问题:

  1. 通用压缩算法,对普通的文章和对日志数据有什么效果区别?
  2. 不同的日志文件大小,对压缩效果有什么影响?
  3. 不同的压缩级别,对压缩效果有什么影响?

论文中主要取 ELK 和 Splunk 为最重要的背景参照。毫无疑问这是目前最主流的日志管理工具。文中介绍:“In addition, log management tools usually divide the input log data

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值