系统运维如何做

应用系统运维运维主要维护的是运行于操作系统层之上的业务系统,那么首先我们要明确一个概念就是实际我们运行的就是一个程序,程序是什么呢实际上程序就是跑起来的代码,1.代码要跑起来首先就要占用系统的资源,内存资源,磁盘资源,cpu资源,网络资源等等,2.程序运行也会有程序运行的逻辑,所谓运行逻辑其实就是,先执行哪一步在执行哪一步,我的程序依赖于哪些程序提供资源也就是从上游系统拿数之类的,然后又把数据给了谁,3.就是从架构的维度我的系统是一个什么架构,使用了哪些技术什么版本之类的,比如我的程序是分前后端的,前端页面用nginx发布,后端就是一个jar包,然后后端连接数据库,数据库使用的是mysql ;

其实以上说的是三个维度我也把他当成三层来分别处理
1.首先我们来说第一层,我叫他资源层,这层包括我们要运行程序所必须的资源,1.1 操作系统,基本要了解操作系统版本型号,如果有余力可以更深入了解1.2 了解资源,内存是多少现在使用率怎么样,硬盘是多少现在使用率是多少,cpu多少核心使用率多少预期未来业务增长会不会有爆炸增长的风险1.3 底层到底是物理机还是虚拟机,虚拟机使用的是云平台还是虚拟化平台如VMware等,1.4 存储是使用的san 存储还是nas 存储,磁盘是否使用了逻辑卷扩容是否方便,1.5 公司网络情况,网络情况需要了解公司有多少个网络区域,每个IP地址段是干啥的,我的应用是内部访问还是需要发布到公网,哪里有防火墙限制,那个段到那个段是不能正常通信的
在这里插入图片描述

2.第二层主要了解程序的运行逻辑以便出现问题时可以快速排查,比如我们的程序主要功能是干什么,我们的用户是哪些人,我们程序对数据处理的过程是什么样的

3.第三层主要是要了解我们程序的部署结构,我们程序有多少个程序包,叫什么名字,使用了什么技术nginx,redis,mysql 等,配置文件存放的位置,日志文件存放的位置,程序启动的端口号

其实在这个过程主要主要还是当发现哪些问题可以联系谁协助排查,如果分析可能是网络问题怎么办,数据库问题怎么处理,主机问题呢,谁可以帮我们处理,他使用的工具是什么原理
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我会尽力回答你关于hadoop系统运维的问题。 Hadoop是一个分布式计算框架,它的运维工作需要考虑到很多方面,包括硬件、网络、软件等等。以下是一些常见的Hadoop系统运维问题及其解决方法: 1. 如何监控Hadoop集群的健康状况? 答:可以使用Hadoop自带的Metrics系统来监控集群的健康状况。Metrics系统会收集各个组件的性能指标,并将其汇总到一个统一的界面上,方便管理员查看。此外,还可以使用第三方监控工具,如Ganglia、Nagios等。 2. 如何优化Hadoop集群的性能? 答:可以从以下几个方面入手进行优化: - 调整Hadoop配置参数,如调整数据块大小、副本数等; - 优化硬件配置,如增加内存、CPU等; - 使用更快的网络设备,如升级网卡、使用InfiniBand等; - 使用更快的存储设备,如使用SSD代替HDD。 3. 如何备份Hadoop集群中的数据? 答:可以使用Hadoop自带的备份工具——DistCp来备份数据。DistCp可以将一个Hadoop集群中的数据复制到另一个Hadoop集群中,也可以将数据备份到本地磁盘或其他存储设备中。 4. 如何升级Hadoop集群? 答:升级Hadoop集群需要注意以下几点: - 仔细阅读官方文档,了解升级过程中需要注意的事项; - 在测试环境中进行升级测试,确保升级过程不会影响生产环境; - 逐个升级各个组件,确保每个组件都能够正常工作; - 在升级过程中备份数据,以防数据丢失。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值