为什么对基础设施的监控变得如此重要?

原创 2015年07月10日 22:57:24

稍微懂点云计算的人都知道三个概念:IaaS「Infrastructure as a Service」、PaaS「Platform-as-a-Service」和SaaS「Software-as-a-service」,其中 IaaS 就是我们常说的基础设施服务。

为什么对基础设施的监控变得如此重要?

简单而言,IaaS 提供了云计算基础架构,包括服务器、存储、网络和操作系统。它作为一种按需服务,使得客户无需购买服务器、软件、数据库空间或网络设备,而只要按需购买这些资源的外包服务就可以了。但是购买了这些资源,并不意味着一劳永逸,这些资源能不能稳定、高效的工作?这其实是一个新的挑战!

为什么需要监控基础设施?

众所周知,几乎所有的应用程序通常都是运行在一个大型动态的环境上,它们依赖于成百上千台主机。当然,这样的方式非常有利于扩展,能够保证良好的用户体验。但是,对运维和业务人员来说,这简直就是「噩梦」,那些传统的监控方式已经跟不上云时代的要求了。

首先,人类已经很难从大规模海量的数据中识别出那些有问题的节点;其次,服务器本身也在不断的变化——根据企业的需求进行动态的拓展或者缩减,单个主机经常会出现响应问题;所以,区分出哪些服务器是否处于一个正常的状态并不是一件很简单的事情。那么,我们就需要一个现代化的监控平台:

第一,必须能够毫不费力地跟踪我们所有的服务器,并且能够在数据量激情的情况下保持稳定;

第二,必须能够分辨出那些可执行程序,尽可能少出现误报问题,还要避免「兴师动众」,反而忽略更重要的问题;

第三,必须能够收集足够多的信息,使我们能够快速诊断出问题发生的根本原因,当然,这也意味着我们的监控平台应该与关键技术相互配合;

第四,应该还能收集详尽的数据以供我们进行分析,并能保留长期的数据用于对未来趋势的预测;

第五,必须能够让我们监控到所有的主机状态,同时也能监测到特定属性的主机。

最后一点,这个作为我们「操作神经中枢」的监控平台,必须能够帮助我们的团队高效地发现潜在问题的信息,如果有一个可视化的仪表板那就更好了,这样就可以有助于我们进行快速、明确的团队沟通。

现有的免费解决方案都有哪些?

当然,现在有很多服务器端的监控软件,而且针对服务器的性能监控也是一个比较新的网络管理方向。现在市面上有不少免费的工具,包括不少开源的产品如 Nagios ,Zabbix 等等,当然,还有一些比较有技术底蕴的公司,像国内 APM 行业的领军企业 OneAPM 也推出了免费的服务器监控产品 OneAPM Servers。

Zabbix

Zabbix 是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位,解决存在的各种问题。

Zabbix 由两部分构成,Zabbix server 与可选组件 Zabbix agent,Zabbix server 可以通过 SNMP,Zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在 Linux、Solaris、HP-UX、AIX,Free BSD、Open BSD以及OS X 等平台上。

Zabbix 主要功能包括: CPU 负荷,内存使用,磁盘使用,网络状况,端口监视,日志监视等等。

Nagios

Nagios 是一款开源的免费网络监视工具,能有效监控 Windows、Linux 和 Unix 的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

Nagios 可以监控的功能包括:监控网络服务;监控主机资源;简单地插件设计使得用户可以方便地扩展自己服务的检测方法;并行服务检查机制;具备定义网络分层结构的能力;报警「通过 EMail、短信、用户定义方式」;定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用;自动的日志滚动功能;支持并实现对主机的冗余监控;可选的 WEB 界面用于查看当前的网络状态、通知和故障历史、日志文件等。

OneAPM Servers:完全免费的专业级服务器监控产品

OneAPM Servers 是一款商业级的服务器监控产品。对比开源产品来讲,在部署安装和学习成本上都占据压倒性的优势。更重要的是,该产品是面向所有用户的性能监控,承诺永久免费,所以刚推出不久就受到很多的关注。

简易部署

如果,你想要使用服务器监控,只需要完成以下四个步骤:

  • 注册登录 OneAPM 账户;
  • 点击菜单栏的「服务器监控」;
  • 点击页面左上角的「添加」按钮;
  • 进入安装页面后,按照安装步骤执行即可。
    安装Si

特色功能

OneAPM Servers 通过观察、分析关键的系统参数,包括 CPU 利用率、物理内存、网络活动、进程、磁盘利用率及容量,展现当前服务器的健康状况。OneAPM Servers 目前包含四大功能:

  • 总览:显示服务器的大体健康情况;
  • 磁盘:展示每一个磁盘的负载及空闲空间;
  • 网络:查看一段时间内宽带「 Kb/s 」,每秒钟传输的包的数量,每秒钟错误率相关细节信息;
  • 进程:展示被监测的服务器上各个系统和用户进程的运行情况。

现在,OneAPM 刚刚推出不久的 OneAPM Servers 产品能够对企业 IDC 和云计算中心内的基础组件进行实时的可视化管理。该套件为用户提供基础组件的集中监控、展现、预警、分析、管控的整体解决方案。通过单一探针,实现对网络设备、主机、操作系统、中间件、数据库、存储等126 种产品的 5 万多项性能指标的集中监控和管理。

版权声明:本文为博主原创文章,未经博主允许不得转载。

监控运维那点事--基础设施监控3

“监控运维那点事”系列基础设施监控的专题文章。
  • qq_28124419
  • qq_28124419
  • 2015年05月12日 10:12
  • 701

SignalR的性能监测与服务器的负载测试

SignalR作为一个及时通讯的框架,稳定性,及时性,延迟这些,更是需要全方位的监测,我们来聊聊SignalR的性能监测与服务器的负载测试...
  • sD7O95O
  • sD7O95O
  • 2016年09月24日 07:22
  • 86

接口性能测试方案

原文链接:http://blog.csdn.net/hexieshangwang/article/details/47186507 一、 性能测试术语解释  1. 响应时间  响应时间即从应...
  • u011138533
  • u011138533
  • 2017年05月02日 09:58
  • 490

原来她在我的生命中如此重要

    她是我高中时的同学,我的死党。她的文采很好,标准的才女,时常可以在各种语文杂志上见到她的文章。那时的功课已很紧张,不过我们几个还是会经常找机会出去疯。我和她的关系一直很好,她很喜欢我,但我心里...
  • Aprin
  • Aprin
  • 2005年04月26日 23:28
  • 1349

为什么算法如此重要

我为什么要问这个问题呢?其实这最近一周时间都在看算法在数据挖掘和存储处理性能上运用. 当然这也引起我个人的一些对算法的思考.正好昨天晚上看到张洋同学的算法杂货铺——分类算法之贝叶斯网络(Bayesia...
  • u013700340
  • u013700340
  • 2014年10月23日 08:15
  • 447

性能测试VS负载测试VS压力测试

性能测试VS负载测试VS压力测试
  • cpcpc
  • cpcpc
  • 2011年01月07日 13:58
  • 983

用Python脚本实现对Linux服务器的监控

一、前言 二、概述 三、Python 版本说明 四、/proc 文件系统 五、对CPU监测 六、对系统负载监测 七、对内存信息的获取 八、对网络接口的监测 ...
  • hh_liu
  • hh_liu
  • 2014年09月04日 11:16
  • 836

用户体验为什么如此重要

用户体验要素:以用户为中心的产品设计(原书第2版)【全彩印刷】 说到我们所使用的那些产品和服务,我们对它们的感情可谓是爱恨交加。它时而令我们备受鼓舞,时而令我们感到沮丧;它使生活变得简单,又使生活变得...
  • hzbooks
  • hzbooks
  • 2011年06月22日 12:35
  • 4918

任卫红:关键信息基础设施的等级保护

任卫红 公安部等级保护评估中心技术部主任 核心观点: 1、关键信息基础设施和等保对象是什么关系 2、等保定级和CII认定过程 3、CII和等保制度关系 一、关键信息基础设施和等保对象是什么关系?...
  • featherli2016
  • featherli2016
  • 2017年08月04日 15:37
  • 1422

服务器监控(包括性能指标与web应用程序)

服务器监控 性能指标监控 Linux性能指标 Web服务器监控
  • heyongluoyao8
  • heyongluoyao8
  • 2016年05月16日 14:25
  • 24948
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:为什么对基础设施的监控变得如此重要?
举报原因:
原因补充:

(最多只允许输入30个字)