![527e6d21afe24892309c0f26d84587db.png](https://img-blog.csdnimg.cn/img_convert/527e6d21afe24892309c0f26d84587db.png)
我的网站为什么一错再错
网页报错,尤其是5XX错误是互联网应用最常见的问题之一。5XX错误通常发生于服务端。服务端是业务逻辑最复杂,也是整条网络请求链路中最容易出错、出了错最难排查的地方。
运维工程师与研发工程师排查此类问题,通常要通过登录机器查看日志来定位问题。对于一般的Java应用错误日志,通常是这幅模样:
![45832a20aec714da954006685ad60e24.png](https://img-blog.csdnimg.cn/img_convert/45832a20aec714da954006685ad60e24.png)
一般来说,对于逻辑不算太复杂、历史不算“太悠久”的应用来说,登录机器看日志的方式能够很大程度上地解决网站报错的问题。但遇到下列情况时,使用传统的方式可能就有些困难:
- 在一个分布式Java应用集群中,我想知道这类错误每分钟发生了多少次,什么时候开始发生的;
- 系统太老,遗留异常我不想管了,我只想知道,今天和昨天相比,发布前和发布后相比,多了哪些异常;
- 我想知道这个错误对应的是哪个Web请求,Web请求的参数是什么;
- 客服给了我一个用户下单失败的订单号,我想知道这个用户下单为啥失败,到底哪里错了