![95ff8b7323ba8396b6c5d5534560a1ca.gif](https://img-blog.csdnimg.cn/img_convert/95ff8b7323ba8396b6c5d5534560a1ca.gif)
一、硬件维护:
硬件维护就是指对服务器的硬件进行检测、更换、升级,最常见的是升级CPU、内存和增加磁盘。其中磁盘扩容是最常见的,因为服务运行的时间越长,产生的数据量就越大,就需要用更多的磁盘来储存。
二、软件维护:
软件维护部分内容比较多,主要有:
1. 操作系统升级:服务器和PC没有本质区别,也运行着基本的操作系统,因此需要升级各种补丁来保护系统安全,规避可能能系统错误。
2. 软件维护:软件即指服务器上运行的各种软件,由于服务器提供的服务往往都在增加,因此提供服务的软件也需要升级,修复BUG,甚至重新编写。
3. 数据维护:数据是服务的核心,所以数据备份是一个经常性的工作。
4. 安全维护:系统往往会存在还没有发现的安全漏洞,通过检查数据库、系统的运行日志,甄别攻击行为,并进行防范。
具体如下:
一、开关机顺序及线缆连接1、开机顺序
打开总电源。打开计算机机柜电源打开外部设备电源(如磁盘阵列、磁带库等)待外部设备自检完成后,最后打开主机电源;集群架构先开存储IO节点,一般情况下存储节点保持24小时开机状态,切记随便开关机操作,然后开管理登录节点,最后开计算节点。
2、关机顺序
进行操作系统的关闭关闭主机电源关闭外设电源.(如磁盘阵列,磁带库等)关闭其他设备电源和机柜电源;集群架构先关计算节点,再关管理登录节点。
3、电缆连接注意事项
在进行电缆连接(插拔)时,最重要的一点是,通过该电缆连接(或将要连接)的设备应当是没有加电的,即应当先将设备的电源关掉,然后再进行电缆连接(插拔)操作。否则,如果带电进行电缆连接,会造成对设备无法预料的损坏(尤其是硬盘)。
二、基本维护常识
1、每天查看集群服务器状态,查看内容包括服务器CPU占用,服务器内存占用、服务器硬盘占用,数据库状态,数据表状态
2、注意服务器各个指示灯的状态
3、每日检测服务器系统软件版本更新信息
4、每30天对服务器安全等级评测一次
5、系统定期自动备份数据,若服务器硬盘空间少于10%,则清理硬盘的日志文件
6、若数据库或数据表状态出现异常,则修复数据表,并整理数据库碎片
7、若发现安全漏洞,则需对系统进行修补,打上补丁
三、系统日志的查看收集
系统日志很重要,因为它可以记录系统中硬件、软件和系统问题的信息,同时还可以监视系统中发生的事件。用户可以通过它来检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹。下面介绍一下windows系统和linux系统下查看收集日志方法:
1、windows系统日志
开始→设置→控制面板→管理工具中找到的“事件查看器”,或【开始】→【运行】→输入 eventvwr.msc 也可以直接进入“事件查看器”。如查看其中“系统”请单击、右键可另存日志文件,以便提供技术人员分析。
2、linux系统日志
平常主要分析messages和dmesg这两个文件,查看日志可以拷贝下来后在windows下用写字板打开查看,也可以在linux下用more或less命令查看。/var/log/dmesg : 核心启动日志./var/log/messages : 系统大部份的讯息皆记录在此, 包括 login, check passw
海普森(Hipeson)——专注计算&助力科研
面向各大高校、科研院所、企事业单位,提供高性能计算产品解决方案