运维
文章平均质量分 78
OneAPM官方技术
北京蓝海讯通科技股份有限公司(以下简称 OneAPM)是一家领先的IT运维管理软件厂商。公司于2008年成立于北京,始终秉承「让运维更加智能」的企业使命,致力于为中国的企业级用户提供一体化的智能运维解决方案。OneAPM 通过10年以上的持续研发和不断创新,目前拥有国内最完整的 IT运维管理产品线和智能探针技术。公司的产品和服务在运 营商、金融、政府、互联网、教育、能源、交通、军工等多个行业获得了广泛应用和一致好评。
展开
-
Fbric、Ansible、Docker、Chaos Monkey:DevOps工具的年中回顾
Fbric、Ansible、Docker、Chaos Monkey:DevOps工具的年中回顾【编者按】近日,Cyber Engineering Solutions Group 技术经理 Hasan Yasar 在 SEI 攥文盘点了当下流行的 DevOps 思想和工具,其中包括Fabric、Ansible、Docker、Chaos Monkey等。本文系 OneAPM 联合高效运维联合编译整理:在翻译 2015-08-10 19:51:57 · 1123 阅读 · 0 评论 -
为什么Nagios会那么吵?你又能做些什么呢?(1)
如果你受困于 Nagios 的告警洪潮中不能自拔,那么这两篇连载博客就是为你而生的。让我们来详细的阐述下这个问题!运维人员都有着独立的监控工具,因此会经常受到 Nagios 告警吵闹的影响。很多运维人员对 Nagios 都是爱恨交加的,Nagios 给了你实时的可见性,可以了解你的 IT 基础设施的内部运作。用 Naigos,你可以辨认出哪一台主机内存不足,哪台服务器会占用太多 CPU 周期,哪一个原创 2015-12-17 10:22:26 · 1095 阅读 · 1 评论 -
Java 应用发布后,需要关注的7个性能指标
在某个重大发布之后,都需要记录相应的指标,本文介绍了最重要的几个 Java 性能指标,包括响应时间和平均负载等。为理解应用程序在生产环境中如何运行,就需要遵循一些 Java 性能指标。在以前,当软件被发布后,开发者是没有方法去了解它在生产环境中的运行情况;而现在,几乎任一个你可以想到的指标都可以被监测和报告。时下,开发者面临的问题并不是缺乏信息,而是信息过载、过大。因此在数百台服务器同时工作的情景下转载 2015-12-16 19:30:27 · 2111 阅读 · 0 评论 -
运维不容错过的4个关键指标!
很难说,生活在这个数据大爆炸的时代对运维同学是福还是祸。灵活的监控系统、开放 API 和易用的数据可视化资源可以将任何想要的数据图表化地显示出来,但是,过多的数据容易产生干扰,反而不利于具体信息提取和操作。关于监控哪些指标,以及为什么要从系统化的角度出发,我们进行过深入的思考。本文中,我们想与大家分享一些具体的指标和准则,进一步帮助团队衡量并提高运维性能。以下整理了4个关键性运维指标:告警事件数量如原创 2015-12-03 10:28:30 · 12423 阅读 · 0 评论 -
用数据说话的运维年度总结该怎么写?
年关将至,又要写年终总结了,运维的工作庞杂又繁琐,一不小心工作总结就写成了流水账,让老板看不出你的成绩不说给再给老板留下不好的印象就更苦不堪言了……转载 2016-01-06 11:08:58 · 2979 阅读 · 0 评论 -
如何把关联性的告警智能添加到 Nagios 上?(2)
上节回顾对于许多 IT 和运维团队来说,Nagios 既是一个福音也是一个诅咒。一方面,Naigos 在 IT 应用的工作领域中,给予了你可以实时查看告警数据的可能性;但是另一方面,Nagios 也能够生成超级多的告警,对于任何一个运维人员或是运维团队来说都是 hold 不住的。由于告警浪潮的原因,我们收件箱时常会爆满,移动电话也会被逼调成静音状态。更令人沮丧的是,这些告警只不过仅仅是噪音而已。Na原创 2015-12-22 11:31:36 · 806 阅读 · 0 评论 -
让我偷偷的告诉你:运维加薪的杀手锏是啥?
临近年底,辛辛苦苦一年该如何跟老板开口谈加薪成了运维人的心病。但是怎么提加薪比较好呢?现在让小编简单介绍下加薪的 3 个杀手锏: 第一、有备而战,一切让业绩说话 不要和老板大谈你正在贷款,买车、买房。。。你必须向公司证明你值得加薪,用数据来证明你的业绩显然是再明智不过的。 第二、关键是让老板知道你对公司的价值 运维无论是在年底或其他时候向老板提出加薪,都必须要清楚知道,这个阶段自己的工作能力原创 2016-01-25 15:00:52 · 1084 阅读 · 0 评论 -
五种令人沮丧的告警垃圾及处理办法!
在 OneAlert,我们经常与运维团队聊天。因为产品开发过程中,这样的对话有助于了解客户的真正痛点。「告警垃圾」——监控系统中时常涌现的告警洪流,是运维团队经常提到的一大痛处。至于其原因,虽然多种多样,但造成的后果都是一样的:信息超载。如果每天收到几十条甚至上百条告警提醒,你很难从中找出急需采取行动的紧迫告警。在那些紧迫的告警中,找出需要立即处理的告警更则难上加难。这种现象有个恰如其分的名字:告警原创 2015-12-24 12:08:15 · 906 阅读 · 0 评论 -
论反馈信息如何推动 IT 运维团队进步?
消息重新传回源头的用时有极大差异,且随着信息传递的必经之路上加入的新节点越多,所用的时间也就越长。总之,数据错误的出现数量和频率与数据传递的路径长度和传递时长成正比。要如何才能更好的运用反馈环路推动 IT 运维团队进步?以下为四点建议。原创 2016-03-18 14:44:22 · 1745 阅读 · 0 评论 -
DevOps 发展融合运维可视化
DevOps,是开发(Development)和运维(Operations)的组合,代表一种文化、运动或实践,旨在促进软件交付和基础设施变更软件开发人员(Dev)和 IT 运维技术人员(Ops)之间的合作和沟通。它的目的是构建一种文化和环境使构建,测试,发布软件更加快捷,频繁和可靠。原创 2016-05-10 15:03:13 · 1994 阅读 · 0 评论 -
运维安全系列基础服务之 FTP 服务(系列一)
做了多年运维工程师,积攒了一些经验,和大家分享下。个人认为,运维安全话题的系列,主要包括下面四个方面:基础服务网络层应用层云安全今天主要讲的是基础服务里面的[FTP服务][ftp]。转载 2015-12-30 17:11:50 · 1378 阅读 · 0 评论 -
运维安全系列基础服务之 FTP 服务(系列一)
做了多年运维工程师,积攒了一些经验,和大家分享下。个人认为,运维安全话题的系列,主要包括下面四个方面:基础服务网络层应用层云安全今天主要讲的是基础服务里面的[FTP服务][ftp]。转载 2015-12-30 16:50:56 · 609 阅读 · 0 评论 -
对抗不可执行告警的四种措施
过量的不可执行告警会造成告警疲劳,浪费时间和资源,从而耽误你解决实质性的问题,可能这些已经在你身边正悄无声息地发生着:你是否自动忽略收到的多余告警?你是否收到很多与你无关的告警?每当你收到告警时,是否为了获得你真正需要的信息而采取一系列常规的行动?如果有以上这样的情况,就能确定你是在遭受着告警疲劳,本篇将会列出四种常见的不可执行告警及其解决办法。转载 2015-12-30 14:10:20 · 446 阅读 · 0 评论 -
DevOps:怎么实现源代码注释和系统文档的自动化更新?
【编者按】计算机软件传统定义为:软件是计算机系统中与硬件相依存的另一部分,软件包括程序、数据及其相关文档的完整集合。然而在时下的开发中,文档的合规性往往被忽视的干干净净。本文由 Todd Waits 撰写,讲述应用程序文档化所遭遇的3个主要挑战,下面一起展开。本文系 OneAPM 联合高效运维编译整理。通常情况下,正式的文档(如源代码文档、系统需求与设计文档,或者各类用户文档)会被开发团队忽视得彻彻翻译 2015-08-25 20:13:14 · 880 阅读 · 0 评论 -
哪些问题困扰着我们?DevOps 使用建议
【编者按】随着 DevOps 被欲来越多机构采用,一些共性的问题也暴露出来。近日,Joe Yankel在「Devops Q&A: Frequently Asked Questions」一文中总结了近段时间参与各种活动中经常遇见的几个问题。本文系 OneAPM 工程师编译整理:从11月至今,在维护 DevOps 博客、参加网络研讨会与各种会议的过程中,笔者遇见了很多有关 DevOps 的各方面问题,包翻译 2015-08-21 19:50:22 · 1329 阅读 · 0 评论 -
如何深入理解 StatsD 与 Graphite ?
众所周知,StatsD 负责收集并聚合测量值。之后,它会将数据传给 Graphite,后者以时间序列为依据存储数据,并绘制图表。但是,我们不知道,基于 http 访问的图表在展示时,是基于每秒钟的请求数,每次留存的平均请求数还是其它。让我们就以此为目标,来一探究竟吧!本文系 OneAPM 工程师编译整理。StatsD为了全面了解 StatsD 的工作原理,我阅读了它的源码。之前我就耳闻 StatsD翻译 2015-09-28 13:48:58 · 1810 阅读 · 0 评论 -
别人7天乐,运维还苦逼值班?
你被点名值班了吗?或者你的朋友、隔壁七大姑八大姨的侄子被点名值班了吗?国庆将至,大家都开始研究各种度假攻略了,国内游、国外游、地球游、外星游。。。然而总有一票人,默默地职守着 – tIT 公司运营支撑组/运维组。这票人的统一特征总结如下:时时刻刻电脑、手机查看邮箱邮箱报警一响,六亲不认飞奔回电脑前尽忠职守外加苦逼OneAlert 专门致力于解放这票兄弟们!OneAlert 通知必达,支持微信原创 2015-09-29 10:14:53 · 1348 阅读 · 0 评论 -
Cloud Insight 仪表盘上线 | 全面监控 Redis
OneAPM 作为应用性能领域的新兴领军企业,近期发布了重量级新产品—— Cloud Insight 数据管理平台,用它能够监控所有基础组件,并通过 tag 标签对数据进行管理。近日,Cloud Insight (Ci) 探针仪表盘功能重磅上线,默认安装了探针,配置平台服务就会自动生成相应的仪表盘,而且仪表盘将包含所有数据。此外,本文也将重点介绍 Redis 的几项监控指标以及一些值得注意的部分,原创 2015-09-15 12:46:10 · 811 阅读 · 0 评论 -
运维 2.0 时代:数据聚合和分组
运维 2.0 时代运维 2.0 是指,从技术运维升级为服务运维,向公司提供可依赖的专业服务。运维 2.0 强调服务交付能力,而不是技术能力,需求可依赖、懂业务、服务化的专业运维。为了了解运维 2.0 时代的监控方式,我们不妨从以前的监控手段说起。首先来了解一下 Zabbix ,通过 Zabbix 能够监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位和解决存在的各原创 2015-11-13 14:32:54 · 828 阅读 · 0 评论 -
OneAPM 云监控部署与试用体验
作为 Zabbix 骨灰级粉丝,一直以来对第三方监控(APM)都是拒绝的。一来觉得收费,二来担心数据被人所知,三来觉得 Zabbix 牛逼到无可取代。但是,随着 APM 市场的火爆,我决定「放下身段」试用一次,并且会总结出它与开源监控之间差别在哪里。运维经历的磨难虽然都在不同的公司,做着不同的业务,但是大多运维总会经历相同的故事,以及背着类似的黑锅。运维们大多有如下经历:原创 2015-10-14 10:35:43 · 1999 阅读 · 0 评论 -
荣誉,还是苦逼?| 也议全栈工程师和DevOps
引言全栈工程师(本文称「全栈」开发者)和 DevOps 无疑是近期最火的词汇,无论是国外还是国内。而且火爆程度远超于想象。全栈和 DevOps,究竟是我们的新职业方向,还是仅仅创业公司老板的心头所爱?且听本文理性分享。Anyway,文末附赠 9 家把 DevOps 搞得风生水起的国外公司及更多信息。本文系 OneAPM 联合高效运维编译整理。 正文最近有两个特别讨厌的趋势:DevOps 和「全栈」开翻译 2015-10-16 10:14:14 · 661 阅读 · 0 评论 -
五大理由分配你的告警
OneAlert 是应用性能管理领军企业 OneAPM 公司旗下产品,也是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。想了解更多信息,请访问 OneAlert 官网 。原创 2015-12-29 12:29:23 · 382 阅读 · 0 评论 -
AIOps需要翻越的「三座大山」
最近AIOps火热的就像8月里的盛夏,运维圈子里的每一个人都在讨论着AIOps,仿佛不聊点AIOps的东西,就透着那么out。原来做运维产品的一众厂商也像打了鸡血似的,纷纷推出花样繁多的AIOps产品,仿佛AIOps是什么传说中的灵丹妙药,一试就灵、包治百病一样。Gartner更是推波助澜,颇为大胆的预测到2022年,将有超过40%的企业会采用AIOps平台技术。睿象科技从18年初开始投入研发力...原创 2019-03-11 10:04:48 · 1238 阅读 · 1 评论