压缩级别_日志通用压缩算法的对比研究

最新推荐文章于 2023-03-09 18:42:29 发布

带刀侍卫杨晁跃

最新推荐文章于 2023-03-09 18:42:29 发布

阅读量855

点赞数

文章标签：压缩级别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36242131/article/details/112678728

版权

这篇博客探讨了通用压缩算法在日志管理中的应用，对比了不同算法在日志数据上的效果，以及文件大小、压缩级别对压缩效率的影响。研究发现，对日志数据，压缩比高的算法如PPMD并不一定是最佳选择，而LZ4在速度和稳定性上表现出色。此外，论文指出理想的块大小在128KB到256KB之间，且高级别的压缩对日志可能并非总是最优，因为消耗资源较多。

摘要由CSDN通过智能技术生成

之前的文章介绍日志领域的研究方向时，曾经提到有些研究关注在日志的压缩方面，毕竟日志实在量太大了！日志易一个规模还可以的股份制银行客户，按照法律要求的存储时长计算磁盘大小，对应的硬件成本就是几千万。

但是这些研究大多有一个问题，那就是它们只考虑如何把日志的存储空间压缩到最小，却并不怎么考虑同时如何继续支撑已有的各种日志管理软件的读写方式——通常来说它们的做法都是自己设计一个索引或者模板提取方式，然后把日志转化过去。

那么，在通用的压缩算法基础上，日志领域还有什么可以研究和发挥的空间么？

前些天看到加拿大女王大学的一篇新论文，解答了这个问题。

A Study of the Performance of General Compressors on Log Filesusers.encs.concordia.ca

论文主要调研了三个问题：

通用压缩算法，对普通的文章和对日志数据有什么效果区别？
不同的日志文件大小，对压缩效果有什么影响？
不同的压缩级别，对压缩效果有什么影响？

论文中主要取 ELK 和 Splunk 为最重要的背景参照。毫无疑问这是目前最主流的日志管理工具。文中介绍：“In addition, log management tools usually divide the input log data

最低0.47元/天解锁文章

带刀侍卫杨晁跃

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
压缩级别_日志通用压缩算法的对比研究

之前的文章介绍日志领域的研究方向时，曾经提到有些研究关注在日志的压缩方面，毕竟日志实在量太大了！日志易一个规模还可以的股份制银行客户，按照法律要求的存储时长计算磁盘大小，对应的硬件成本就是几千万。但是这些研究大多有一个问题，那就是它们只考虑如何把日志的存储空间压缩到最小，却并不怎么考虑同时如何继续支撑已有的各种日志管理软件的读写方式——通常来说它们的做法都是自己设计一个索引或者模板提取方式，然后把...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。