![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AIOps
文章平均质量分 88
嘉为蓝鲸
与大家分享最新IT研发、运维、运营侧资讯
展开
-
【广州银行信用卡中心】5分钟实现一键发布!
通过自动化运维平台-应用发布中心,赋能应用发布效能提升,大大提升信用卡中心生产上线交付效率,节省上线人力投入成本,降低出错率,切实提升了运维质量。。原创 2023-03-09 17:26:28 · 79 阅读 · 0 评论 -
一文详解什么是软件部署
软件应用一般由开发人员进行程序源代码的编写,调试,集成构建,打包提交给测试人员。测试通过后程序包发布,最后由运维人员进行软件应用的部署。简单的说,软件部署就是把开发好的软件应用给到用户正常使用的过程。...原创 2022-08-03 12:03:09 · 1341 阅读 · 0 评论 -
什么是敏捷型的运维组织,金融企业真的需要吗?
与传统企业相比,敏捷企业聚焦于极致用户体验,以实现客户旅程的端到端优化。原创 2022-06-16 14:33:47 · 299 阅读 · 0 评论 -
分享三个关于CMDB的小故事...
我们在服务客户的过程中常常发现,不同岗位对于同一个产品的需求不尽相同。01. 是什么让他沉迷Excel无法自拔?小张是一名运维工程师,负责做公司配置表格的维护。目前公司的配置信息以Excel表格为主要维护手段,他每天都要打开不同的Excel表格,表里密密麻麻记录着资产和配置统计等信息,根据当日的维护状况按时更新和维护。尤其这些年,公司的业务在扩张,系统的数量越来越多,每次维护起来有些手忙脚乱,需要仔细记录和核对数据,避免出现数据不一致等情况。当公司就一两个业务,两三个系统的时候,拥有多年工作原创 2022-05-28 20:07:57 · 132 阅读 · 0 评论 -
ITIL4之后,运维管理层面该如何发力?
ITIL 4自19年正式对外发布,至今已经有2年了,目前已经建立了较为完整的框架体系。运维领域因为ITIL 4的发布带来较大改变,因此本次直播我们将围绕ITIL 4出现前后的运维侧的改变为主题进行讲述,内容分三大部分:ITIL 4说了什么、ITIL 3与ITIL 4的区别对比、我们应该如何提升IT服务管理水平。01. ITIL 4 说了什么?我们先来看一下ITIL的演进过程,ITIL最早是在1980提出,九年后出版了第一本ITIL书籍,但是在当时并没有引起人们的关注,也没有被太多人认可。20原创 2022-05-28 20:05:39 · 298 阅读 · 0 评论 -
企业运维仅关注业务连续性是不够的,这两方面也很重要
自从我学习和通过了精益(Lean IT leadership)、敏捷(Scrum Master)、DevOps(DevOps Master)相关认证后,对运维管理和运维工作本身有了新的思考和启发。本文我们将围绕保障业务连续性、敏捷交付业务价值和提升员工满意度3个阶段进行探讨,同时分享不同阶段的实现思路供各位参考。01. 运维管理的终极目标——BVSSH运维管理的最重要的职责之一是保障业务连续性——负责系统的运行维护,保障业务安全稳定地运行。时过境迁,在VUCA的数字化时代,运维管理仅关注业务连续原创 2022-05-28 19:59:30 · 448 阅读 · 0 评论 -
为了避免智能运维AIOps只是一句空话,我们还要做哪些准备?
需要思考这个问题的原因,是因为AIOps不是到了某一个点就突然质变的,而是在持续演进过程中实现的。随着算法的日益成熟,整个运维体系也在改进的过程中逐渐完善,AIOps的道路才会慢慢清晰。因此,在达到目标之前,我们需要仔细规划怎么做才能更快实现AIOps。本文主题是“AIOps之前,运维层面能做什么?”,由嘉为蓝鲸金融行业顾问总监赵海兵老师为大家带来解答。本文内容分为三个部分:①自动化运维的目标:端到端的自动化②自动化运维的价值:呈现与度量③运维数据管理:过程融合与结果治理。为了避免A原创 2022-05-28 19:56:43 · 367 阅读 · 0 评论 -
如何从零开始建立起一个公司的运维体系?
近期从知乎上看到一个很具有讨论性的问题:如何从零开始建立起一个公司的运维体系?这是由一位刚刚毕业的学生提出的,一个毕业生,思考从0建设公司的运维体系,本身就不是一个可落地的事情。但从方法论角度来看,这个问题是有解的。首先,回答怎么做之前,先思考要不要建立一个运维体系。这个和你的公司的现状有关。Case1:公司规模小,有开发团队,没有运维团队:建议不要建立一套运维体系,而是基于DevOps的角度来思考。简而言之,在这种体系下,研发运维一体化,研发需要承接运维工作。尤其是当你们的业务是实时再线对原创 2022-01-10 16:49:52 · 1699 阅读 · 0 评论 -
智能运维探索:有一种多指标异常检测方案,你可能没用过...
各行业信息化程度迅猛发展的今天,各大企业的信息系统也日趋庞大和复杂。为了保证系统的正常运行,企业的运维人员会通过相应的KPI(Key Performance Indicator, 关键性能指标)对系统进行监控。当某些KPI发生异常时,能够及时发出告警,通知相关人员。一、监控告警系统的数据检测现状现有的监控告警系统大部分采用人工设定规则或阈值的方式来实现。在某些情况下,这些方法确实简单有效,但在中大型业务系统中,我们往往会面临更多的KPI数量,更复杂的KPI间的关联关系,以及更多样性的KP原创 2021-12-24 10:52:07 · 1785 阅读 · 1 评论 -
AIOps是如何在腾讯IEG体系化推进和普及的?
10月,由嘉为科技携手腾讯蓝鲸智云联合主办的智慧生长·研运未来暨2021年研运治理实践大会在北京成功召开。在20日下午进行的智能化运维分论坛上,来自腾讯IEG技术运营部的蓝鲸AIOps负责人盘隆同与会嘉宾探讨了AIOps在蓝鲸的实践思路和路径,并带来了《AIOps如何在腾讯IEG体系化推进与全面普及》的专题演讲。运维领域,没有企业不在谈AIOps和如何建设AIOps,但是很多企业会缺少深度思考:AIOps的建设去向何方?以什么样的模式来建设?需要具备哪些基础能力?以及最为重要的是:我们的组织如何准备原创 2021-11-21 12:00:16 · 1673 阅读 · 0 评论 -
智能运维AlOps——日志异常检测新方法
一、背景日志数据是一种广泛可用的数据资源,用于记录各种软件系统中运行时的系统状态和关键事件。开发人员通常利用日志数据来获取系统状态、检测异常和定位根本原因。隐藏的丰富信息为分析系统问题提供了一个很好的视角。因此,通过在大量日志数据中挖掘日志信息,数据驱动的方法可以帮助增强系统的健康、稳定性和可用性。随着现代计算机系统规模和复杂性的增加,日志数据呈爆炸式增长。有大量数据驱动的方法可以自动检测异常,例如基于主成分分析(PCA)的方法、基于不变挖掘的方法和基于工作流的方法,基于深度学习的方法如:DeepL原创 2021-11-21 11:56:42 · 3875 阅读 · 0 评论 -
如何告别“人工运维”,借助算法进行告警关联挖掘分析?
背景近年来互联网技术高速发展,接入监控告警的设备和业务也越来越多,不断增新的设备和业务使得告警的量级也逐级递加。各种软硬件模块每天会产生大量的告警信息,这些告警中有表象告警,有冗余告警,也有根因告警。每次故障出现都会引发一系列错综叠加的告警,从而将根因告警淹没在里面,导致故障识别异常困难。一般告警分析主要是靠运维人员进行处理,当告警出现时,常常要求运维人员必须在最短的时间内,正确地判断出告警中存在的关联性,然后根据自己的经验采取相应的措施。然而面对海量告警,靠人工从大量告警中找到故障原因...原创 2021-08-20 15:01:37 · 959 阅读 · 0 评论 -
【AIOps探索】基于CauseInfer方法的根因定位
背景近些年来,在需要支持多平台的互联网应用中,越来越多的公司选择从单体系统迁移到微服务架构。微服务系统通常包含成百上千的应用,这些系统是高度动态和复杂的,一个服务可以有几个到几千个实例运行在不同的容器和服务器上,而可用性问题一直是大规模微服务系统面临的一个关键挑战。在这些系统中,服务质量(如性能、可靠性)的任何异常都有可能沿着服务调用链传播,由少量的根因节点影响到关联节点,并最终导致业务级别的可用性问题(如访问成功率下跌)。针对运维中的难题,全球权威的IT研究与顾问咨询公司 Gar...原创 2021-07-16 17:18:31 · 1109 阅读 · 3 评论