Flume14：Flume的进程监控

最新推荐文章于 2024-08-19 10:48:06 发布

做一个有趣的人Zz

最新推荐文章于 2024-08-19 10:48:06 发布

阅读量1.3k

点赞数 1

分类专栏： flume 文章标签： hadoop flume 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40612128/article/details/123238116

版权

flume 专栏收录该内容

17 篇文章 1 订阅 ¥19.90 ¥99.00

订阅专栏

本文介绍了Flume的进程监控重要性，当Agent服务意外停止时可能导致数据丢失和延误发现。通过创建`monlist.conf`配置文件和监控脚本`monlist.sh`，实现了对Flume Agent的监控及异常时的自动重启功能，以确保数据采集的连续性和可靠性。利用crontab进行定时执行，以达到实时监控和故障恢复的目标。

摘要由CSDN通过智能技术生成

一、Flume的进程监控

Flume的Agent服务是一个独立的进程，假设我们使用source->channel->sink实现了一个数据采集落盘的功能，如果这个采集进程被误操作干掉了，这个时候我们是发现不了的，什么时候会发现呢？

可能第二天，产品经理找到你了，说昨天的这个指标值有点偏低啊，你来看下怎么回事，然后你就一顿操作猛如虎，结果发现原始数据少了一半多，那是因为Flume的采集程序在昨天下午的时候被误操作干掉了。

找到问题之后，你就苦巴巴的手工去补数据，重跑计算程序，最后再找产品经理确认数据的准确性。

类似的问题会有很多，这说明你现在是无法掌控你手下的这些程序，他们都是不受控的状态，说不定哪天哪个程序不高兴，他就自杀了，不干活了，过了好几天，需要用到这个数据的时候你才发现，发现的早的话还能补数据，发现晚的话数据可能都补不回来了，这样对公司来说就是属于比较严重的数据故障问题，这样你年终奖想拿18薪就不太现实了。

所以针对这些存在单点故障的进程，我们都需要添加监控告警机制，最起码出问题能及时知道，再好一点的呢，可以尝试自动修复重启。

那针对Flume中的Agent我们就来实现一个监控功能，并且尝试自动重启

了解本专栏

做一个有趣的人Zz

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
Flume14：Flume的进程监控

一、Flume的进程监控Flume的Agent服务是一个独立的进程，假设我们使用source->channel->sink实现了一个数据采集落盘的功能，如果这个采集进程被误操作干掉了，这个时候我们是发现不了的，什么时候会发现呢？可能第二天，产品经理找到你了，说昨天的这个指标值有点偏低啊，你来看下怎么回事，然后你就一顿操作猛如虎，结果发现原始数据少了一半多，那是因为Flume的采集程序在昨天下午的时候被误操作干掉了。找到问题之后，你就苦巴巴的手工去补数据，重跑计算程序，最后再找产品经理确认数
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

做一个有趣的人Zz 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。