深入浅出Spark2.1.0度量系统——Sink继承体系

最新推荐文章于 2024-07-10 11:39:04 发布

泰山不老生

最新推荐文章于 2024-07-10 11:39:04 发布

阅读量2.3k

点赞数 3

分类专栏：大数据 Spark Scala Metrics 深入理解Spark 文章标签： spark Metrics Sink Source Scala

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/beliefer/article/details/82965948

版权

本文介绍了Spark2.1.0度量系统的Sink部分，包括Sink的定义、常见度量输出方式，以及ConsoleSink、CsvSink、MetricsServlet、JmxSink、Slf4jSink和GraphiteSink等六种Sink的具体实现。Slf4jSink的实现通过Slf4jReporter将度量输出到日志，便于后续查看和分析。

摘要由CSDN通过智能技术生成

阅读提示：阅读本文前，最好请阅读《Spark2.1.0——深入浅出度量系统》和《深入浅出Spark2.1.0度量系统——Source继承体系》。

Source准备好度量数据后，我们就需要考虑如何输出和使用的问题。这里介绍一些常见的度量输出方式：阿里数据部门采用的一种度量使用方式就是输出到日志；在命令行运行过Hadoop任务（例如：mapreduce）的使用者也会发现控制台打印的内容中也包含度量信息；用户可能希望将有些度量信息保存到文件（例如CSV），以便将来能够查看；如果觉得使用CSV或者控制台等方式不够直观，还可以将采集到的度量数据输出到专用的监控系统界面。这些最终对度量数据的使用，或者说是输出方式，Spark将它们统一抽象为Sink。Sink的定义见代码清单1。

代码清单1 度量输出的定义

private[spark] trait Sink {
  def start(): Unit
  def stop(): Unit
  def report(): Unit
}

从代码清单1可以看到Sink是一个特质，包含三个接口方法：

start：启动Sink；
stop：停止Sink；

最低0.47元/天解锁文章

泰山不老生

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。