测试flink实时流系列（六）：测试总结

最新推荐文章于 2024-04-22 23:49:21 发布

Yannick_J

最新推荐文章于 2024-04-22 23:49:21 发布

阅读量364

点赞数 1

文章标签： flink kafka big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/don_chiang709/article/details/103477796

版权

Kafka 同时被 2 个专栏收录

7 篇文章 1 订阅

订阅专栏

3 篇文章 1 订阅

订阅专栏

一、DataGen发包服务器

可以用多个脚本（HiBench/bin/workloads/streaming/repartition/prepare/dataGen.sh）来发起多个进程来发包，但并不是越多进程越好。因为进程（java）本身也要消耗CPU/MEM，所以要根据自己的平台来适配。TX2 服务器上测试中发现，4个进程即可以达到最优。如果起16/32/48个进程，反而性能下降。

二、用dstat来监控数据流

在kafka/datagen服务器上启动dstat来监控网络及磁盘的流量，来分析网络和磁盘是否达到了最大带宽。

三、可以搭建ZK及kafka集群

1。搭建zk及kafka集群来消除kafka数据生产者的带宽及磁盘IO限制。已经搭建多台datagen发包服务器往一个kafka集群提供数据。

2。kafka服务器配置12个HDD或者1个PCIE NVME disk，因为kafka checkpoint及log需要消耗大量的磁盘IO。

四、搭建flink服务器

增加flink task( -ytm 6144 )和job（-yjm 8192）的内存配置，yarn counter(-yn 6) ，yarn slot（-ys 4）来提高性能，如下：

./bin/flink run -m yarn-cluster -yn 6 -ys 4 -ytm 6144 -yjm 8192 -c com.intel.hibench.flinkbench.RunBench /home/flink/HiBench-7.0/flinkbench/streaming/target/flinkbench-streaming-7.1-SNAPSHOT-jar-with-dependencies.jar /home/flink/HiBench-7.0/report/repartition/flink/conf/sparkbench/sparkbench.conf

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
测试flink实时流系列（六）：测试总结

一、DataGen发包服务器可以用多个脚本（HiBench/bin/workloads/streaming/repartition/prepare/dataGen.sh）来发起多个进程来发包，但并不是越多进程越好。因为进程（java）本身也要消耗CPU/MEM，所以要根据自己的平台来适配。TX2 服务器上测试中发现，4个进程即可以达到最优。如果起16/32/48个进程，反而性能下降。二、用...
复制链接

扫一扫

专栏目录

Yannick_J CSDN认证博客专家 CSDN认证企业博客

码龄12年

148: 原创

3万+: 周排名

1万+: 总排名

108万+: 访问

: 等级

8415: 积分

457: 粉丝

469: 获赞

81: 评论

2842: 收藏

私信

关注

热门文章

分类专栏

管理学堂 1篇
打油诗集 5篇
UFS 5篇
BE
NAND
Ceph 67篇
Jenkins 3篇
Spark 34篇
Hadoop 23篇
linux kernel 30篇
Yarn 12篇
SparkSQL 4篇
存储 20篇
面试 3篇
Linux 22篇
nandflash 4篇
Eclipse 6篇
Database 4篇
闲谈 7篇

最新评论

linux FIO命令详解(一)：磁盘IO测试工具 fio (并简要介绍iostat工具)
鱼丸粉丝: 我这边找到一点点答案,如果你还是对这个问题有疑惑的话,裸盘读写的数据没有文件系统的情况下,它是以二进制的形式进行存储的,而且只是文件本身,如果你真的想做数据分析的情况下可以往二进制编解码靠拢,但是消耗的的时间成本希望你可以把控.
K8S入门系列（一）：Kubernetes的历史(由来)与架构
PasteSpider: 这里推荐用PasteSpider,为啥？ 1.你的K8S挂了，你的服务挂不挂？ PasteSpider就不一样了，他就真的只是个工具，辅助你部署而已，其他活都是其他零件在干，比如路由是nginx，服务运行是docker/podman,系统承载是Linux和PasteSpider有啥关系！实际环境中你把PasteSpider这个服务直接删除，你的服务也不会受影响！ 2.复杂程度，你没个一星期你敢动手上K8S？给你一个月时间你也不敢打包票没问题！ PasteSpider就不一样了,30分钟从开始到上项目！，就类似windows的图形操作，点点点，按照表单输入些东西就行，至于资料都是现成的，遇到问题了查下执行的日志记录，然后找对应的，比如路由找nginx的方案,私有仓库找registry的，容器的问题找docker或者Podman的，服务器的你找Linux对应的去！ 3.资源消耗 K8S你没个32GB内存的服务器你敢玩？PasteSpider我1GB就能上了，实际运行的时候PasteSpider内存消耗大概在200多MB这样子！ 4.PasteSpider也是开源不过和K8S不一样的是，PasteSpider采用的是局部开源，就是开源的对象是使用者，而不是随便的人都能下载源码！ 5.基本功能PasteSpider一个不落 a.平滑升级，采用nginx的滚动策略进行升级 b.支持集群部署，就是多台服务器运行 c.你可以局域网部署，也就是PasteSpider用到的资料全部用局域网的权限的，比如账号啥的 d.部署环境隔离，默认测试环境，生产环境，自定义其他环境，环境之间隔离的，一般体现在配置文件不一样 e.部署人和配置文件是错开的，部署的人可以看不到配置文件，由超级管理员指定！ f.文件同步，基于文件md5计算，每次都是增量升级，不需要全部覆盖提交，保证发布文件的正确性 g.个性化配置，支持Key-value模式，支持导入容器运行的环境Environment,接合环境模式可以配置不一样的运行配置。 h.配置后也支持开发电脑源码发布-->服务器上打包-->PasteSpider上构建-->推送到私有仓库registry-->分发给服务器拉取镜像-->部署滚动升级服务-->执行结果推送！更多介绍搜索 https://soft.pastecode.cn/Hom获取......
make的-j命令（加速Linux程序编译）
dujunqiu: 好想法，不过使用 tmpfs的话，要注意不要修改的文件掉电丢失了
specjbb 牵手 jdk 系列（二）：安装jdk及运行specjbb
m0_73539168: 你好，我的环境是jdk-21的版本，我在运行specjbb2015遇到了和您同样的报错，但我在执行解决办法的命令时，无法成功添加库，想请问一下应该怎么解决呢，期待回复，谢谢~
十大经典排序算法动画与解析
电子聪: 哇，这图好像看不了了~~

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。