医院网络管理员职责
系统管理员对于组织及其网络运营中心和数据中心的可靠和成功运营至关重要。 系统管理员必须具有系统底层平台(即Windows,Linux)的专业知识,并且必须熟悉多个领域,包括网络,备份,数据还原,IT安全,数据库操作,中间件基础知识,负载平衡等。 Sysadmin任务不仅限于服务器管理,维护和维修,还包括支持平稳运行的生产环境且客户和最终用户的投诉最少(或没有投诉)的任何功能。
尽管系统管理员的职责似乎无穷无尽,但有些职责比其他职责更为重要。 如果您以系统管理员角色工作(或希望有一天),请确保您已准备好遵循这些最佳实践。
文献资料
文档是系统管理员如何记录资产的记录,包括硬件和软件类型,计数和许可证。 如果生产环境中存在任何问题,则文档可帮助您确定可能涉及的硬件,虚拟机,设备,软件等。
硬件清单
维护所有物理和虚拟服务器的列表,其中包含以下详细信息:
- 操作系统: Linux或Windows,带有版本的管理程序
- RAM:物理服务器中的DIMM插槽
- CPU:逻辑和虚拟CPU
- HDD:硬盘的类型和大小
- 外部存储(SAN / NAS):具有管理IP地址和接口IP地址的存储的类型和型号
- 开放端口:在服务器端打开的用于传入流量的端口
- IP地址:具有VLAN的管理和接口IP地址
- 工程设备:例如Exalogic,PureApp等
软件清单
- 配置的应用程序:例如,Oracle WebLogic,IBM WebSphere Application Server,Apache Tomcat,Red Hat JBoss等。
- 第三方软件:安装的操作系统未附带的任何软件
许可证详细信息
维护物理服务器和虚拟服务器(VM)的许可证计数和详细信息,包括Windows的许可证,Linux OS的订阅以及虚拟机监控程序主机的许可证限制。
服务器运行状况检查
- 正在运行的进程:检查消耗的资源是否超出预期的进程,并采取措施对应用程序进行微调(在应用程序团队的帮助下)。
- CPU使用率: 始终监视并检查关键进程(例如“ java”,“ http”,“ mysql”等)的CPU使用率,以确保这些进程不会消耗过多的CPU资源。 如果是这样,则与应用程序团队协调以在应用程序级别对其进行检查并进行微调。 并行分析OS参数,例如“ Ulimits”。
- 内存利用率:检查内存利用率并根据需要清除缓存。
- 僵尸进程:终止进程后,检查进程表中PID仍然存在的进程。 僵尸进程会降低服务器性能,因此请找到并杀死所有存在的进程。
- 平均负载:如果您遇到性能问题,请检查平均负载并调整服务器的性能。
- 磁盘/ SAN / NAS利用率:检查外部连接的存储的I / O报告以跟踪和检查读/写操作的速度。 如果发现任何问题,请立即与存储和网络团队协调以解决问题。
备份和灾难恢复计划
与备份团队进行沟通,并向他们提供备份的数据和客户端优先级。 生产服务器的建议备份标准是:
- 增量备份:每天,星期一至星期五
- 完整备份:周六和周日
- 灾难恢复演练:每月与备份团队进行一次恢复模拟演练(最好是每季度一次),以确保在出现问题时可以恢复数据。
打补丁
必须立即实施针对已知漏洞的操作系统补丁。 补丁的类型和级别很多,包括:
- 安全
- 危急
- 中等
发布补丁程序后,请检查错误或漏洞详细信息以查看其如何应用于您的系统(例如,漏洞是否会影响系统中的硬件?),并在需要时采取任何必要的措施来应用补丁程序。 确保使用补丁程序或升级来交叉验证应用程序的兼容性。
应用程序兼容性
在使用任何应用程序之前,请检查其与您的硬件和操作系统的兼容性,并确保进行负载测试(在应用程序团队的支持下)。
服务器强化
Linux:
- 设置BIOS密码:这样可以防止用户更改BIOS设置。
- 设置GRUB密码:阻止用户更改GRUB引导程序。
- 拒绝root用户访问:拒绝root用户访问可以最大程度地降低入侵的可能性。
- Sudo用户:设置 sudo用户并分配有限的特权来调用命令。
- TCP包装器:这是保护服务器免受黑客攻击的武器。 将规则应用于SSH守护程序,以仅允许受信任的主机访问服务器,并拒绝所有其他主机。 对其他服务(例如FTP,SSH文件传输协议等)应用类似的规则。
- Firewalld / iptables:为进入服务器的流量配置firewalld和iptables规则。 包括特定的端口,源IP和目标IP,并允许,拒绝,拒绝公用区域和专用区域的ICMP请求等。
- 防病毒:安装防病毒软件并定期更新病毒定义。
- 保护和审核日志:定期并在需要时检查日志。
- 轮转日志: 将日志保留有限的时间,例如 “ 7天”,以保留足够的磁盘空间以进行完美的操作。
视窗:
- 设置BIOS密码:这样可以防止用户更改BIOS设置。
- 防病毒:安装防病毒软件并定期更新病毒定义。
- 配置防火墙规则:防止未经授权的各方访问您的系统。
- 拒绝管理员登录:限制用户进行更改的能力,这些更改可能会增加系统的漏洞。
使用系统日志服务器
通过在环境中配置系统日志服务器以保留系统日志和应用程序日志的记录,在发生入侵或问题时,系统管理员可以检查以前的实时日志以诊断和解决问题。
自动化
必须在特定时间执行许多系统管理员任务(例如服务器运行状况检查,资源利用率,备份触发器,传输文件和日志等)。 因此,系统管理员必须编写脚本或使用外部工具,并将其配置为cron作业,才能在适当的时间自动执行任务。
监控工具
安装和配置实时监控工具,例如Nagios,HP等,以监控您的IT基础架构并发出有关潜在问题的警报。
结论
尽管这些是系统管理员负责的最重要的任务,但角色的作用远远超过此列表中的职责。
例如,系统管理员必须与多个团队协作来解决问题,与客户沟通和更新,维持100%的正常运行时间,与审核团队进行讨论,准备每周/每月/每季度的报告,使用适当的工具对服务器和服务进行连续监控,并维护硬件控制台并响应所有触发的警报。
sysadmin始终是数据中心或网络运营中心中的单点内容(SPOC),用于解决与Web托管,应用程序和服务器中断以及其他关键IT运营问题相关的问题。
您认为系统管理员还需要其他哪些任务或最佳实践? 请在评论中分享您的意见。
翻译自: https://opensource.com/article/19/7/sysadmin-best-practices
医院网络管理员职责