AIOps
森先生
Stay real, love job, life, family.
展开
-
阿里巴巴自动化运维演进
阿里应用运营团队,首先要做所有日常运维的工作,像发布、扩容、重启、修改脚本等。另外就是环境的维护,比如操作系统升级这些也都是运维团队需要介入很多的。除了日常运维措施以外,阿里运维团队还会负责容量管理。一个典型的案例,比如每年的“双11”我们都会定一个指标,比如大家今年都知道阿里巴巴在今年“双11”17.5万笔的交易笔数峰值,其实我们在年初的时候,就会按照这个交易笔数去算,17.5万笔需要多少机器,每个应用需要怎么去分布?以前都是运维团队会介入,投入非常多的人力来计算怎么样去分布机器。所以容量管理会成为整个运转载 2020-11-28 22:07:49 · 563 阅读 · 0 评论 -
阿里巴巴智能运维建设之路
回归到大企业,工作中开始逐渐正规化,IT工作的整体专业架构也清晰。突然开始要搞运维的事情。其实不太想这个主题,因为我觉得我不应该关注这么细节的内容,但从总结的角度还是说一下。1、智能化运维过去是【自动化】,现在强调【智能化】。行业变化很快,对传统企业而言,要达到智能化还是需要很长的路。但未来应该是智能化运维2、智能化运维我们怎么做我的几个理解①需要一定的规模如果企业的IT没有一定的规模,想也不要想,这个做没有意义,对于很多小企业而言,比较可能的情况是把机器放在云上。由专业的第三方来负转载 2020-11-28 22:06:29 · 604 阅读 · 0 评论 -
百度智能化探索之路
转载 2020-11-28 22:08:17 · 139 阅读 · 0 评论 -
L-1 AIOps在美团的探索与实践——故障发现篇
总第415篇2020年 第39篇AIOps,最初的定义是Algorithm IT Operations,是利用运维算法来实现运维的自动化,最终走向无人化运维。随着技术成熟,逐步确定为Artificial Intelligence for IT Operations——智能运维,将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习的方式来进一步解决自动化运维无法解决的问题。本文系AIOps在美团的探索与实践的第一部分,如何自动发现故障问题,其中重点介绍了美团转载 2020-11-28 22:08:28 · 345 阅读 · 0 评论