Flink监控和调优笔记

最新推荐文章于 2024-10-04 03:40:27 发布

darling.0

最新推荐文章于 2024-10-04 03:40:27 发布

阅读量127

点赞数

分类专栏： Flink 文章标签： flink 大数据

本文链接：https://blog.csdn.net/daliyuan350649623/article/details/126604087

版权

Flink 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

Flink监控和调优

History Server

Hadoop MapReduce

Spark

Flink

start/stop-xxx.sh

看一下这些脚本的写法

shell对于bigdata有用吗？ lower

配置：

historyserver.web.address: 0.0.0.0

historyserver.web.port: 8082

historyserver.archive.fs.refresh-interval: 10000

jobmanager.archive.fs.dir: hdfs://hadoop000:8020/completed-jobs-pk/

historyserver.archive.fs.dir: hdfs://hadoop000:8020/completed-jobs-pk/

启动：./historyserver.sh start

思考：有了HistoryServer之后为什么还需要提供REST API？

Ganglia

Flink中常用的优化策略

1）资源

2）并行度

默认是1 适当的调整：好几种 ==> 项目实战

3）数据倾斜

100task 98-99跑完了 1-2很慢 ==> 能跑完、跑不完

group by：二次聚合

random_key + random

key - random

join on xxx=xxx

repartition-repartition strategy 大大

broadcast-forward strategy 大小

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

darling.0

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

flink实战--metrics监控与rest api

阿华田的博客

05-24

1万+

Flink metrics简介 Flink的metrics是Flink公开的一个度量系统，允许收集flink程序的公开指标到外部系统，我们也可以自定义指标通过metric收集，实际开发时经常需要查看当前程序的运行状况，flink 提供了 UI 界面，有比较详细的统计信息。但是 UI 界面也有不完善的地方，比如想要获取 flink 的实时吞吐。本文将详细介绍如何通过metric......

Flink 系统性学习笔记

SmartSi

07-31

1675

Flink 学习笔记

参与评论您还未登录，请先登录后发表或查看评论

162-《大数据架构师》实时数仓项目实战（三）flink项目优化，集群个数电商业务指标，监控的restAPI，暂时没用...

okbin1991的博客

09-16

通过flink restApi进行监控 flink至少一次和精准一次两阶段提交

Flink学习资料

10-09

附件：Flink-on-yarn部署指南 0、Flink基本原理与生产实践 1、Flink基本概念与部署 2、DataStreamAPI介绍与实战 3、Window与Time 4、Connector 5、Flink状态管理与恢复 6、Metrics与监控 7、Flink应用案例介绍 8、Druid基本概念以及架构设计 9、Druid数据存储与写入 10、Druid实践介绍

Flink调优详解：案例解析（第42天）

syhiiu的博客

07-21

5914

本文主要详解常见的Flink优化策略。

IT学习笔记--Flink

xudasong123的博客

06-03

1133

Data Sources 就字面意思其实就可以知道：数据来源。Flink做为一款流式计算框架，它可用来做批处理，即处理静态的数据集、历史的数据集；也可以用来做流处理，即实时的处理些实时数据流，实时的产生数据流结果，只要数据源源不断的过来，Flink 就能够一直计算下去，这个 Data Sources 就是数据的来源地。Flink 中你可以使用 StreamExecutionEnvironment.addSource(sourceFunction) 来为你的程序添加数据来源。

【Flink】Flink on RocksDB 参数调优指南

九师兄

06-14

6087

1. 背景对于需要保存超大状态（远超于内存容量）的流计算场景来说，目前 RocksDB [1] 是 Flink 平台上官方实现的唯一选择。业界也有使用 Redis 等其他服务作为状态后端的方案，但终究不够成熟，且已被社区否决 [2]. 基于我们长期的状态调优经验，通过合理的资源分配，RocksDB 方案可以稳定支持上百 GB 甚至上 TB 的总状态量；但是众所周知的是，RocksDB 的可调参数非常繁琐，有上百个之多，且彼此之间还相互影响，非常难以调整。更致命的是，默认参数和配置不当的参数，读写性能会比.

Flink on RocksDB 参数调优指南

张普的专栏

01-23

1442

对于需要保存超大状态（远超于内存容量）的流计算场景来说，目前 RocksDB [1] 是 Flink 平台上官方实现的唯一选择。业界也有使用 Redis 等其他服务作为状态后端的方案，但终...

尚硅谷大数据项目之Flink实时数仓-踩坑记录和笔记记录

prague6695的博客

08-11

2585

尚硅谷大数据项目之Flink实时数仓-踩坑记录和笔记记录

flink笔记1（初识 Flink）

weixin_60440795的博客

09-11

414

Flink 是第三代分布式流处理器，它的功能丰富而强大。

Flink学习笔记

君永夜

08-27

1682

前言：Flink是当前主流的实时计算框架，阿里的Blink重构了Flink即能做全量数据的批处理，也能做增量数据的实时处理；大数据的业务数据处理分为两个步骤：全量数据批计算，以及增量数据的实时计算，有时处理的业务逻辑是一致的但是代码确是两套，繁琐；当前主流的大数据实时计算框架有： Spark Streming、Kafka Streaming、Storm、Flink、Blink（阿里双十二的主流实时...

流处理系统(Flink, Kafka和Pravega)学习笔记

小凯的博客

02-28

2364

本文记录一下我比较感兴趣的实时流处理方面的知识，从计算Flink，到存储Pravega，再到消息中间件Kafka，理论知识四大方面学习。如有错误请在评论区指正。实时更新~ 理论知识三种语义 At most Once 接收者最多收到一次消息 At Least Once 发送者给接收者发送消息，如果一直收不到接收者的确诊消息，发送者会一直重发。 Exactly Once 对于一条消息，接...

Flink源码剖析

最新发布

weixin_37172178的博客

10-04

847

执行环境 ExecutionEnvironment数据抽象 DataSet DataStream逻辑操作 Source Transformation Sink1. 获取执行环境2. 通过执行环境对象，注册数据源Source，得到数据抽象3. 调用数据抽象的各种Transformation执行逻辑计算4. 将各自Transformation执行完毕之后得到的计算结果数据抽象注册Sink5. 提交Job执行。

如何在 Amazon EMR 中运行 Flink CDC Pipeline Connector

Turk的专栏

09-29

925

flink设置保存点和恢复保存点

qq_41519442的博客

09-28

389

要增加hadoop客户端的使用。查看对应的jobId。

Flink集群部署

IT深耕十余载，大道之简

09-30

1080

综上所述，Flink集群部署是一个复杂但至关重要的过程。通过仔细准备环境、下载与安装软件、配置参数、启动集群以及进行测试与验证等步骤，可以确保Flink集群的稳定性和可用性。同时，在选择部署模式和注意事项方面也需要根据实际需求进行权衡和决策。Flink支持多种部署模式，包括Standalone模式、YARN模式和Kubernetes模式等。在选择部署模式时，需要考虑集群的规模、资源利用率、可维护性等因素。

Flink CDC实时同步MySQL到Doris

weixin_42828342的博客

09-28

1626

Apache Flink CDC（Change Data Capture）是一个用于捕获和跟踪数据库更改的技术，它能够实时地从数据库中获取数据变更，并将这些变更流式传输到其他系统进行处理和分析。Flink CDC 提供了对多种数据库的支持，包括 MySQL、Doris、MongoDB 等，Flink CDC 在大数据中主要用于实时数据同步、实时数据分析、实时监控和告警、日志和审计记录、流式ETL、实时事件处理等方面。

Flink从ck拉起任务脚本

zfqzpp的专栏

10-02

360

备注：由于Flink checkpoint 个别情况下，不一定能保证落地的checkpoint文件一定有效，所以需要人工介入支持。

Prometheus Grafana 监控 Flink 实践指南

"该资源是关于如何使用 Prometheus 和 Grafana 监控 Apache Flink 的教程。Prometheus 是一款流行的开源监控系统，而 Grafana 则是一个用于可视化监控数据的工具。通过这两个工具，我们可以对 Flink 应用的运行状态...