想要观测您的主机,看这个就够了

随着时代的发展,云、云原生等技术的大量采用,越来越多的企业把业务系统迁移到线上,依赖着主机、服务器、网络、数据库、容器等,享受着应用系统带来的高敏捷性和生产力。然而,越来越复杂的IT系统已经让传统运维工程师无力完成全面的IT环境监控,宕机、系统崩溃、数据丢失、安全等问题将如环太平洋火山带随时随地准备着喷发。特别是对于一些重度依赖业务系统的企业,每一个问题都可能带来无法估量的损失。那么,如何更加快速、更加便捷的对IT环境进行全面监控呢?

前往观测云官网,注册一个账号,就可以免费使用“观测云”,让你的主机可观测,无论是传统主机、服务器、还是公有云或私有云对象,通过安装 DataKit,即可在工作台实时监测主机的状态、名称、操作系统、处理器、内存,网络,磁盘、连接跟踪、文件等。更有丰富的关联查询、自定义label、交互式主机分布图等功能,您不仅可以对主机进行统一管理,还可以从整体上观测主机状态。

方法/步骤

Step1:安装数据采集器

前往观测云官网,注册一个账号后,即刻登录观测云,免费开始主机可观测。在开始进行观测前,您需要在工作台,点击左侧「集成」选择顶部「Datakit」,通过对应的安装命令安装属于您工作空间的采集器。更多 Datakit 使用介绍,可参考文档服务安装和管理

Step2:开启主机对象采集器

在宿主机/服务器上完成 DataKit 安装后,您可以依据以下步骤开启主机对象数据收集:

  1. 进入 DataKit 安装目录下的 conf.d/host 目录,复制 hostobject.conf.sample 并命名为 hostobject.conf。

  2. 配置完成后, 使用命令 datakit --restart,重启datakit 。

  3. 配置完成后,系统会默认开启一批与主机相关的采集器,并主动上报数据至“观测云”工作空间。默认开启的采集器列表如下:

采集器名称

说明

cpu

采集主机的 CPU 使用情况

disk

采集磁盘占用情况

diskio

采集主机的磁盘 IO 情况

mem

采集主机的内存使用情况

swap

采集 Swap 内存使用情况

system

采集主机操作系统负载

net

采集主机网络流量情况

host_processes

采集主机上常驻(存活 10min 以上)进程列表

hostobject

采集主机基础信息(如操作系统信息、硬件信息等)

container

采集主机上可能的容器对象以及容器日志

更多主机对象数据采集,可参考帮助文档 DataKit主机采集器

Step3:开启云同步

如果 DataKit 所在的主机是云主机(目前支持阿里云/腾讯云/AWS/华为云/微软云),你可以通过 cloud_provider 标签开启云同步,具体步骤如下:

1.进入 DataKit 安装目录/usr/local/datakit下的 conf.d/host 目录,复制 hostobject.conf.sample 并命名为 hostobject.conf。

2.打开 hostobject.conf 文件,开启如下配置:

  • 开启inputs.hostobject.tags

  • 开启 cloud_provider = "aliyun"

3. 配置完成后, 使用命令 datakit --restart, 重启datakit 即可生效。

4. 开启了云同步后,系统会主动上报如下字段至“观测云”工作空间(以同步到的字段为准):

字段名

描述

cloud_provider

云服务商

description

描述

instance_id

实例 ID

instance_name

实例名

instance_type

实例类型

instance_charge_type

实例计费类型

instance_network_type

实例网络类型

instance_status

实例状态

security_group_id

实例分组

private_ip

实例私网 IP

zone_id

实例 Zone ID

region

实例 Region ID

更多主机对象数据采集,可参考帮助文档 DataKit主机采集器

Step4:查看主机数据

在 “观测云” 工作空间「基础设施」-「主机」中,您可以通过主机对象列表查看当前空间最近24小时内每个主机的数据信息,包括主机名称及标签、主机的CPU使用率、MEM使用率,CPU的单核负载等。

​点击主机对象列表中的主机名称,即可划出主机详情页,查看主机的详细信息,如硬件型号、基础资源消耗、关联的日志、进程、事件等。

更多主机对象分析,可参考帮助文档 主机

进阶参考

关联分析

  • 挖掘关联数据

假如您需要构建全面深入的主机可观测,开启主机相关的其他数据采集器后,即可通过“观测云”工作台一键挖掘主机相关的日志、进程、异常事件、容器、网络、安全巡检。

​开启主机相关的其他数据采集器,可参考日志进程异常事件容器网络安全巡检

  • 自定义内置视图

自定义内置视图可以帮助您绑定关联视图到主机详情页面,实现数据的联动查看。依据您相关分析的需求,通过选择官方系统视图或自定义的用户视图作为内置视图,不仅方便您使用官方模版快速扩宽主机关联分析的范围,还支持您自定义编辑新的监控视图。

以观测 label标签为“测试”的主机对象CPU 为例,添加系统视图“CPU 监控视图”为主机详情的内置视图,联动查询主机 CPU 状态。具体步骤如下:

  1. 在 观测云 工作空间「管理」-「内置视图」,选择 系统视图“CPU 监控视图”。

  2. 点击“编辑”,选择字段为 label:测试 的对象为绑定关系

  3. 点击“确定”,创建绑定关系

​4. 在对应的查看器详情页面查看该内置视图。

​更多配置详情,可参考绑定内置视图

交互式主机拓扑图

实现多主机环境的可观测,离不开一张可以清晰显示机房运维环境的拓扑图。在“观测云”工作台,通过切换页面左上角查看器至「主机拓扑图」,能够帮助您可视化查询主机的指标数据大小,进而快速分析不同系统、不同状态、不同版本、不同地区等自定义标签下的主机的运行状态。

了解更多,可参考主机拓扑图

自定义指标集

为了便于您将熟悉的指标分类,“观测云”支持您在主机采集器中,通过配置[inputs.hostobject.tags],自定义 tag 赋予主机对象一个新的特征,并将这个特征用于筛选出相关主机对象。

​详细的配置方法可参考:DataKit主机采集器

自定义label

为了方便您能更灵活、有效的管理IT基础设施环境,观测云提供基础设施 label 的功能,支持您基于 label 标签对主机进行归类、搜索、筛选和集中管理。

​更多label使用方法可参考基础设施label妙用

更多功能

以上为主机可观测的基础示例,如需了解更多产品资讯、技术分享、系统监测方案等内容可关注我们,或加入观测云官方交流群。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值