运维:大数据(hadoop、spark)性能优化

本文探讨了Linux系统优化,包括调大预读缓冲区、使用noatime选项减少写入操作以及监控IO负载。接着,针对Hadoop的优化,分析了hdfs du -sk操作导致的负载问题及其解决方案,以及HDFS JAVA API的APPEND异常。最后,提到了Spark优化的相关链接。通过这些优化措施,可以提升大数据处理的效率。
摘要由CSDN通过智能技术生成

Linux优化

调大预读缓冲区大小来提高性能

https://blog.csdn.net/xiaolang85/article/details/17790267

【JC】HDFS的可以调整为blockdev --setra 8192 /dev/sda

 

在Linux中,使用noatime选项挂载磁盘,以减少不必要的写入操作。

可以减少记录最新一次更新时间。

 

查看io负载

CentOS 7.2中磁盘iowait过高解决 https://www.linuxidc.com/Linux/2017-08/146267.htm

Iowait的成因、对系统影响及对策 https://blog.csdn.net/yunlianglinfeng/article/details/77822295

iowait 过高问题的查找及解决linux https://www.cnblogs.com/happy-king/p/9234122.html

iostat是I/O statistics(输入/输出统计)的缩写,用来动态监视系统的磁盘操作活动。

iostat程序需要通过sysstat包安装

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值