自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

pezynd的专栏

持续更新,欢迎关注,欢迎指点!!

  • 博客(6)
  • 资源 (9)
  • 收藏
  • 关注

转载 转载 | 字节跳动 Flink 单点恢复功能实践

背景在字节跳动的实时计算场景中,我们有很多任务(数量 2k+)会直接服务于线上,其输出时延和稳定性会直接影响线上产品的用户体验,这类任务通常具有如下特点: 流量大,并发高(最大的任务并行度超过 1w) 拓扑类似于多流 Join,将各个数据源做整合输出给下游,不依赖 Checkpoint 没有使用 Checkpoint 并且对短时间内的小部分数据丢失不敏感(如 0.5%),但对数据输出的持续性要求极高 在 Flink 现有的架构设计中,多流 Join 拓扑下单个 Task 失

2020-09-28 09:56:02 138

原创 大数据理论篇 No.1-浅谈Flink中的数据传输

第1章 疑问Flink在作业运行过程中,TaskManager之间会不断的进行数据交换,而TaskManager进程里是以Slot为单位执行任务的,一个TaskManager里可以有多个Slot,每个Slot之间都可能进行连接,并且传输数据,而在流计算的场景中,数据之间的交互需要非常的即使,但是如果每一次交互都立即传输,对网络资源的消耗会非常大,Flink是如何解决这一问题的呢?第2章 缓冲区图1Slot之间传输数据的时候,实际是将数据先收集到缓存区中,而并非逐个发送,当数据被存到缓存区后,

2020-09-23 21:27:44 669 1

原创 大数据实操篇 No.12-Kafka集群部署及使用

第1章 简介Kafka作为一个高吞吐量的分布式发布订阅消息系统,在现今大数据生态中已经占有很重要的地位,在系统削峰、解耦等场景上也发挥了重要作用。其天生的分布式架构,可以灵活的进行扩展,可以非常好的支持大吞吐量的数据传输。因为其在大数据场景中的重要地位,并且后续文章案例中需要使用到Kafka,所以笔者这里单独介绍一章。第2章 集群规划Kafka笔者这里只安装2台另外,由于Kafka需要使用Zookeeper,Zookeeper相关部署请参照笔者之前的文章:大数据实操篇 No.1-Zoo.

2020-09-16 21:34:13 298 2

原创 大数据实操篇 No.11-Flink on Yarn集群HA高可用部署及使用

第1章 简介Flink on Yarn的HA高可用模式,首先依赖于yarn自身的高可用机制(ResourceManager高可用),并通过yarn对jobmanager进行管理,当jobmanager失效时,yarn将重新启动jobmanager。其次flink job在恢复时,需要依赖checkpoint进行恢复,而checkpoint的快照依赖于hdfs的高可用,同时jobmanager的元数据信息也依赖于hdfs的高可用(namenode的高可用,和多副本机制),再者jobmanager元数据的指

2020-09-05 16:22:38 4635 8

原创 记一次.NET HttpHandler接口性能优化过程(续)

第1章简介在上一篇文章中《记一次.NET HttpHandler接口性能优化过程》解决了同一客户端并发请求问题之后,IHttpHandler接口仍然是同步的模式,我们需要改成异步的模式,并将登录接口和业务接口拆开来,分别实现IRequiresSessionState和IReadOnlySessionState,已提高效率。这里需要思考两个问题:第一个问题是兼容:接口的修改需要考虑兼容性问题,原有接口建议不做改动;第二个问题是要考虑如何在前端代码不做任何改动的前提下,进行接口方法的重构。目的是做到接口的.

2020-09-02 20:55:58 250

原创 记一次.NET HttpHandler接口性能优化过程

第1章 简介本文介绍基于.NET Framework4.0环境的一次接口优化:当接口接收来自同一客户端(同一Session会话)的多个异步请求时,处理并发问题的优化;案例以笔者近期改进项目上的接口性能为例。接口以实现HTTPHandler的方式接收客户端请求。主函数实现了IHttpHandler和IRequiresSessionState接口。下面开始详细的问题发现和解决步骤。第2章 发现问题2.1 JMeter压力测试现象2.2 服务器运行资源情况2.2.1应用服务器...

2020-09-01 19:06:03 421 1

windbg-x64 dump分析工具

Windbg是在windows平台下,强大的用户态和内核态调试工具。相比较于Visual Studio,它是一个轻量级的调试工具,所谓轻量级指的是它的安装文件大小较小,但是其调试功能,却比VS更为强大。它的另外一个用途是可以用来分析dump数据。

2022-01-16

ANTS Performance Profiler 8 安装包

ANTS Performance Profiler 8 内存分析工具,性能调优工具。监控应用程序、iis进程、windows服务等等。

2022-01-16

.net memory profiler 4.0.114 内存分析工具

.Net Memory Profiler(以下简称Profiler):专门针对于.NET程序,功能最全的内存分析工具,最大的特点是具有内存动态分析(Automatic Memory Analysis)功能。

2022-01-16

azkaban-3.86.0安装包

azkaban-3.86.0 源码编译安装包,可直接放到服务器进行部署。注意配合自己相应的mysql版本驱动使用。

2022-01-16

flink-sql-client.zip

flink sql依赖jar包整理

2022-01-16

flink-hive-jar.zip

Flink写入Hive相关依赖jar包,解压后可直接放置到flink lib目录下。包含:flink-connector-hive,flink-shaded-hadoop-3-uber,flink-hadoop-compatibility,hive-exec等等。

2022-01-16

mysql-jdbc-connector-java-5.1.44

mysql jdbc连接驱动mysql-connector-java-5.1.44.zip 注意版本。许多框架需要连接mysql管理元数据信息,都需要这个依赖jar才能进行使用,解压后将相应的jar包放到自己框架的使用目录下即可。

2020-08-02

Flink1.11.0源码手动编译包

Flink1.11.0源码手动编译包 编译步骤详见:https://blog.csdn.net/dzh284616172/article/details/107571972

2020-07-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除