项目目标
为某移动云的运维体系提供硬件设备的集中带外管理监控能力,为硬件设备的远程监、管、控提供工具支撑,为既有的运维体系提供监控采集的数据,为运维优化和决策提供数据支撑。
解决方案
1、增加带外管理功能,使用户能够更加方便地管理和监控各种设备,提高设备管理效率和可靠性,减少系统维护的停机时间,并提供更好的远程管理功能。
2、大幅提高运营商服务器的纳管数量,需覆盖20万台服务器,跨品牌、品类、型号,并发稳定,实现千万级数据解析及上亿级大数据存储在数据中心、远程办公或分布式环境中的设备管理中发挥着重要的作用。不仅提高设备的利用率和管理效率,也降低设备的故障率和维护成本。
- X86支持监控灯、故障灯、事件灯,批量开关机、电源状态查看;
- X86批量配置BMC功能上线:Trap配置及测试、SYSLOG配置、用户配置、NTP配置、服务配。
- IPXE裸机部署相关模块上线:主机规划、模板管理、介质管理、部署报告。
- 设备纳管模块上线
- 取数校对模块上线
- 采集机管理模块上线
应用成效
1、可纳管20万设备
用户可纳管20万的设备,服务器每小时产生超过4000条的日志数据,这些海量数据被精准捕捉并用于项目的实时监控和后续分析。
2、实现每小时千万级的数据处理能力
在数据处理方面,实现每小时千万级的数据处理能力,确保数据的高效流通和精准分析。无论是设备状态监控、用户行为分析还是业务趋势预测,系统都能够迅速给出准确的反馈和建议。
3、构建上亿级的大数据存储系统
数据存储方面,构建上亿级的大数据存储系统,确保各类数据的安全可靠存储,为项目的长期稳定运行提供了坚实保障。
4、支持8000+用户使用,并发量稳定
此外,该项目成功支持8000多名用户,并发量稳定,用户体验良好。同时,我们与30多个设备厂商建立了合作关系,涵盖了100多种不同型号的设备,充分满足了客户的多元化需求。