号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部
上午好,我的网工朋友。
Datadog作为一款专为云时代设计的监控和分析平台,近年来受到了越来越多网工的青睐。
它不仅提供了全面的监控功能,还通过实时性能分析、自定义仪表盘、警报通知和强大的日志管理功能,帮助咱更好地掌握系统运行状态,快速响应异常情况。
今天就来讲讲Datadog这个好用工具,并且把软件资源给到大家。
今日文章阅读福利:《 Datadog 软件资源》
私信我,发送关键词“Datadog”(建议复制一下直接发哈),即可获取资源。
01 什么是 Datadog ?
Datadog 是一款专为云时代的应用程序而设计的监控和分析平台,旨在帮助企业监视其应用程序、基础设施、日志和安全性,并提供实时性能分析和可视化工具。
Datadog 能够集成各种云服务和技术堆栈,为用户提供全面的数据分析和监控解决方案。
要实现全面,持续的监控,你需要一个强大的监控系统来存储并将指标可视化,当异常发生时能提醒你,Datadog就是一个很好的选择。
Datadog 的功能:
1.全面监控:Datadog 可以监视云端、基础设施、应用程序性能、日志等各个方面,提供全面的监控和分析功能。
2.实时性能分析:通过实时性能分析工具,用户可以快速发现和解决潜在问题,保障应用程序的稳定运行。
3.自定义仪表盘:用户可以根据自己的需求和偏好创建自定义仪表盘,以便清晰地查看关键指标和数据。
4.警报和通知:Datadog 支持设置警报规则,一旦系统出现异常情况,将会及时通知用户,帮助他们快速响应问题。
5.日志管理:Datadog 还提供强大的日志管理功能,帮助用户收集、存储和分析日志数据,帮助他们更好地理解系统运行情况。
02 Datadog 使用详情
首先说明一下使用背景:
192.168.1.148 是受监控os的ip地址,在该主机上,安装有一个10.2版本的pg cluster。该主机需要连接互联网。
1.注册安装:
在受监控os上安装datadog的agent:
[root@pgserver ~]# su - pg102
Last login: Mon May 14 22:15:48 EDT 2018 on pts/1
[pg102@pgserver ~]$ pg_ctl status
pg_ctl: server is running (PID: 1167)
/usr/local/pg102/bin/postgres
[pg102@pgserver ~]$
vi /etc/yum.repos.d/datadog.repo[datadog]name = Datadog, Inc.baseurl = https://yum.datadoghq.com/stable/6/x86_64/enabled=1gpgcheck=1gpgkey=https://yum.datadoghq.com/DATADOG_RPM_KEY.public
sudo yum makecache
sudo yum remove datadog-agent-base
sudo yum -y install datadog-agent
sh -c "sed 's/api_key:.*/api_key: 21e325413e240c5ae46e394fd69a1150/' /etc/datadog-agent/datadog.yaml.example > /etc/datadog-agent/datadog.yaml"
Re-start the Agent on Centos 7 and above:
systemctl restart datadog-agent.service
Re-start the Agent on Centos 6:
initctl start datadog-agent
2.建立对 postgresql 数据库的监控
建立用户(注意:密码使用的是如下网站生成的密码):
https://app.datadoghq.com/account/settings#integrations/postgres
create user datadog with password 'grAVckwkQEybdN52w3YVpfZV';
alter user datadog with superuser; ----这一句是我自己加的。
grant SELECT ON pg_stat_database to datadog;
3.进行测试测试:
psql -h 192.168.1.148 -U datadog -d postgres -p 5532 postgres -c "select * from pg_stat_database LIMIT(1);" && \
echo -e "\e[0;32mPostgres connection - OK\e[0m" || \
echo -e "\e[0;31mCannot connect to Postgres\e[0m"
密码是grAVckwkQEybdN52w3YVpfZV
注意:此处的密码是datadog网站给我生成的密码,每个人从datadong网站获得的密码应该是不一样的,请注意使用该密码时替换。
vi/etc/datadog-agent/conf.d/postgres.d/conf.yaml
init_config:
instances:
- host: 192.168.1.148
port: 5532
username: datadog
password: grAVckwkQEybdN52w3YVpfZV
tags:
- optional_tag1
- optional_tag2
4.重启agent以便使agent采集postgresql的数据:
systemctl restart datadog-agent.service
检查agent是否工作正常,特别注意“postgres区域”的输出是否正常。
datadog-agent status
5.然后就可以回到datadog的 dashboard中查看postgresql数据库的监控指标了。
至此,所有工作结束。
也许有人说,没见你安装datadog的服务器端啊?
确实,datadog的服务器端在www.datadoghq.com上,这就是datadog公司只做云监控的原因。
(我个人估计是这样的实现思路:每个人在datadoghq.com注册时,会有一个api key。
类似上面的
21e325413e240c5ae46e394fd69a1150这是每个人的“身份证”)
整理:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部