夜莺 v6 中心机房部署
n9e 监控服务
IP: 192.168.*.* 端 口: 17000
安装部署
安装路径192.168.*.* /opt/n9e
- Mysql : 存放配置类别信息,如用户,监控大盘,告警规则等
- Redis : 存放访问令牌(JWT Token),心跳信息,如机器列表中CPU、内存、时间偏移、核数、操作系统、CPU架构等
# 创建个 n9e 的目录,后面把 n9e 相关的文件解压到这里
mkdir -p /opt/n9e && cd /opt/n9e
# 下载 n9e 发布包,amd64 是 x84 的包,下载站点也提供 arm64 的包,如果需要其他平台的包则要自行编译了
tarball=n9e-v6.2.0-linux-amd64.tar.gz
urlpath=https://download.flashcat.cloud/${tarball}
wget -q $urlpath || exit 1
# 解压缩发布包
tar zxvf ${tarball}
# 解压缩之后,可以看到 n9e.sql 是建表语句,导入数据库
mysql -un9e -proot@pwd -h192.168.*.* -P3386 < n9e.sql
# 启动 n9e,使用systemd 托管,写入service 文件
echo "[Unit]
Description=n9e
After=network.target
[Service]
Type=simple
ExecStart=/opt/n9e/n9e
WorkingDirectory=/opt/n9e
Restart=on-failure
SuccessExitStatus=0
LimitNOFILE=65536
StandardOutput=syslog
StandardError=syslog
SyslogIdentifier=n9e
[Install]
WantedBy=multi-user.target" | sudo tee /etc/systemd/system/n9e.service
systemctl enable n9e
systemctl start n9e
# 检查 n9e.log 是否有异常日志,检查端口是否在监听,正常应该监听在 17000
ss -tlnp|grep 17000
VictoriaMetrics 时序数据库
VictoriaMetrics 下载地址在 github releases 上,单机版本的 VictoriaMetrics 监听在 8428 端口。
安装部署
安装路径 192.168.. /opt/victoria-metrics
# VictoriaMetrics 解压缩之后,里边就一个二进制:
tar -xvf victoria-metrics-linux-amd64-v1.94.0.tar.gz -C /opt/victoria-metrics/
echo "
[Unit]
Description=VictoriaMetrics
[Service]
ExecStart=/opt/victoria-metrics/victoria-metrics-prod
WorkingDirectory=/opt/victoria-metrics/
Restart=on-failure
[Install]
WantedBy=multi-user.target" | sudo tee /etc/systemd/system/victoriametrics.service
systemctl enable victoriametrics
systemctl start victoriametrics
打通夜莺和 VictoriaMetrics
在夜莺里配置一个 VictoriaMetrics 的数据源
Categraf 采集器
Categraf 项目简介 - 快猫星云 (flashcat.cloud)
categraf启动时 可以通过
-configs
参数指定配置目录,如果不指定,会默认读取工作目录下的conf。
conf 目录结构如下:
config.toml
# 主配置logs.toml
# logs-agent 配置prometheus.toml
# prometheus agent 配置traces.yaml
# trace-agent 配置conf/input.*/*.toml
插件配置文件
安装部署
# 下载 categraf
wget https://download.flashcat.cloud/categraf-v0.3.32-linux-amd64.tar.gz -P /opt/
# 解压缩
tar -xzvf /opt/categraf-v0.3.32-linux-amd64.tar.gz -C /opt/
# 重命名
mv /opt/categraf-v0.3.32-linux-amd64 /opt/categraf
# systemd 托管
cp /opt/categraf/conf/categraf.service /etc/systemd/system/
# 启动
systemctl enable categraf
systemctl start categraf
被监控节点部署(Agent)
scp -r /opt/categraf_bak 192.168.*.*:/opt/categraf
ssh 192.168.*.*
cp /opt/categraf/conf/categraf.service /etc/systemd/system/
systemctl enable categraf
systemctl start categra
修改配置文件 categraf/conf/config.toml
# 修改hostname 命名规范 [appname]-[node|master No]-[0.0]
sed -i 's/^hostname = .*/hostname = "app-0.1"/' /opt/categraf/conf/config.toml
# 修改数据上报API
sed -i '/^\[\[writers\]\]/,/^url =/ s#url = .*#url = "http://192.168.*.*:17000/prometheus/v1/write"#' /opt/categraf/conf/config.toml
# 修改心跳数据API
sed -i '/^\[heartbeat\]/,/^url =/ s#url = .*#url = "http://192.168.*.*:17000/v1/n9e/heartbeat"#' /opt/categraf/conf/config.toml
监控Reids实例 categraf/conf/input.redis/redis.toml
[[instances]]
address = "192.168.*.*:6379"
labels = { instance="redis-192.168.*.*:6379"}
[[instances]]
address = "192.168.*.*:6379"
labels = { instance="redis-192.168.*.*:6379"}