日志系列--程序日志处理挑战与方案

最新推荐文章于 2023-09-20 23:59:00 发布

云栖精选

最新推荐文章于 2023-09-20 23:59:00 发布

阅读量207

点赞数

摘要： 程序日志（AppLog）有什么特点？ * 内容最全：程序日志是由程序员给出，在重要的地点、变量数值以及异常都会有记录，可以说线上90%以上Bug都是依靠程序日志输出定位到 * 格式比较随意：代码往往经过不同人开发，每个程序员都有自己爱好的格式，一般非常难进行统一，并且引入的一些第三方库的

程序日志（AppLog）有什么特点？

处理程序日志会有哪些挑战？

1. 数据量大

程序日志一般会比访问日志大1个数量级：假设一个网站一天有100W次独立访问，每个访问大约有20逻辑模块，在每个逻辑模块中有10个主要逻辑点需要记录日志。

则日志总数为：

100W * 20 * 10 = 2 * 10^8 条

每条长度为200字节，则存储大小为

2 * 10^8 * 200 = 4 * 10^10 = 40 GB

这个数据会随着业务系统复杂变得更大，一天100-200GB日志对一个中型网站而言是很常见的。

2. 分布服务器多

大部分应用都是无状态模式，跑在不同框架中，例如:

对应实例数目会从几个到几千，需要有一种跨服务器的日志采集方案

3. 运行环境复杂

程序会落到不同的环境上，例如：

为了能够获得全貌，我们必须把所有数据统一并存储起来。

如何解决程序日志需求

1.统一存储

目标：要把各渠道数据采集到一个集中化中心，打通才可以做后续事情。

我们可以在日志服务中创建一个项目来存储应用日志，日志服务提供30+种日志采集手段：无论是在硬件服务器中埋点，还是网页端JS，或是服务器上输出日志，都可以在实时采集列表中找到。

在服务器日志上，除了使用SDK等直接写入外，日志服务提供便捷、稳定、高性能Agent-Logtail。logtail提供windows、linux两个版本，在控制台定义好机器组，日志采集配置后，就能够实时将服务日志进行采集，这里有一个5分钟视频。

在创建完成一个日志采集配置后，我们就可以在项目中操作各种日志了。

可能有人要问到，日志采集Agent非常多，有Logstash，Flume，FluentD，以及Beats等，Logtash和这些相比有什么特点吗？

2. 快速查找定位

目标：无论数据量如何增长、服务器如何部署，都可以保证定位问题时间是恒定的

例如有一个订单错误，一个延时很长，我们如何能够在一周几TB数据量日志中快速定位到问题。其中还会涉及到各种条件过滤和排查等。

例如我们对于程序中记录延时的日志，调查延时大于1秒，并且方法以Post开头的请求数据：

Latency > 1000000 and Method=Post*

对于日志中查找包含error关键词，不包含merge关键词的日志

3. 关联分析

关联有两种类型，进程内关联与跨进程关联。我们先来看看两者有什么区别：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
日志系列--程序日志处理挑战与方案

摘要：程序日志（AppLog）有什么特点？ * 内容最全：程序日志是由程序员给出，在重要的地点、变量数值以及异常都会有记录，可以说线上90%以上Bug都是依靠程序日志输出定位到 * 格式比较随意：代码往往经过不同人开发，每个程序员都有自己爱好的格式，一般非常难进行统一，并且引入的一些第三方库的程序日志（AppLog）有什么特点？内容最全：程序日志是由程序员给出，在重要的地点、变量
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。