AIOps正准备成为IT管理的下一个重点。这是人工智能与传统IT运营的融合。与所有其他域一样,AI将对系统操作和管理产生重大影响。当AI的强大功能应用于运营时,它将重新定义基础架构的管理方式。
数据中心GRAPHICSTOCK.COM
IT基础架构会生成大量数据。从机箱的温度到API调用的延迟率,可以从堆栈的不同层获取数据。在汇总,规范化和分析时,这些数据成为获取洞察力的丰富资源。
以下是AIOps的五个用例:
1)容量规划
尽管容量规划已经通过云基础架构变得动态,但架构师仍然发现很难将工作负载映射到正确的服务器和VM配置。
主流云提供商(如AWS,Azure和Google)有许多用于运行VM的配置。基础架构架构师必须从各种参数中进行选择,包括CPU类型,可用内存,网络吞吐量,磁盘类型,磁盘I / O和VM放置。随着企业工作负载开始迁移到云,云提供商将继续添加新配置,这只会增加复杂性。
通过应用AI,可以将工作负载映射到服务器和虚拟机的正确配置。在将工作负载运行到峰值状态后,AIOps可以推荐正确的实例系列类型,存储选择,网络配置,甚至存储的IO吞吐量。这可以通过将工作负载特征与适当的IT资源配置相对应来消除猜测。
2)资源利用
云为基础架构带来了弹性,应用程序可以通过它自动扩展和扩展。缩放操作要么是被动的,要么是主动的。在响应式扩展中,基于诸如CPU消耗或队列中的待处理项的数量之类的参数来调整资源。还可以安排缩放操作以触发特定时间窗口处的动作。
使用AIOps,管理员将依赖于预测性扩展,其中基础架构根据历史数据智能地调整自身。它将学习如何根据当前和预期的使用模式重新配置自身。
预测性扩展使云IaaS的自动扩展功能更上一层楼。没有规则和配置设置来实现弹性。工作负载将确定监视自身所需的最佳资源。
3)存储管理
AIOps并不仅限于计算资源。存储和网络也会受到AI应用于运营的影响。
管理生产工作负载时,会持续监控存储资源,以获得最佳性能和利用率。当性能因IOPS较低或磁盘几乎已满而性能下降时,管理员会收到警报。通过将AI引入存储操作,校准磁盘和重新配置它们等普通任务是自动化的。通过预测分析,可以通过主动添加新卷来自动调整存储容量。
AI可以解决与存储管理相关的高级操作的基础问题。
4)异常检测
AIOps可以从源自技术堆栈的各个层的数据近乎实时地检测异常。
由于应用程序和基础架构日志的结构是时间序列数据,因此可以应用高级机器学习算法来查找异常值。AIOps可以通过精确定位实际来源来准确地突出显示这些异常值,这可以帮助IT团队几乎实时地执行有效的根本原因分析。
异常检测是AIOps的主要用例之一。它可以防止基础设施面临的潜在中断和中断。
5)威胁检测和分析
AIOps将在增强IT基础架构的安全性方面发挥关键作用。通过应用机器学习算法和启发式算法,可以检测并避免异常和风险事件。
通过将AI应用于安全管理,IT团队可以检测到各种违规和违规行为。来自各种内部源(如netflow日志,应用程序事件日志和DNS日志)的数据可与外部威胁情报源相结合,例如恶意IP列表和域可用于分析。先进的机器学习算法可用于识别基础架构中的意外和潜在的未授权和恶意活动。
AIO,AI和ITOps的融合,将改变基础设施管理的面貌。该技术将影响企业数据中心和云基础架构管理。