编写一个探测端口异常的Python脚本

在工作中需要时刻关注服务进程的健康状态或者metrics进程的健康状态,可以监控其服务的端口,下面编写一个监控kafka服务进程和其metrics进程的端口的Python脚本,直接上代码:

import socket
from prometheus_client import start_http_server,Summary
from prometheus_client import start_http_server, Gauge
from prometheus_client.core import CollectorRegistry
from prometheus_client.core import Gauge
import random
import time

# IP 地址到主机名的映射
ip_to_hostname = {
    "10.110.1.110":"hostname1",
    "10.110.1.111":"hostname2",
    "10.110.1.112":"hostname3",
}

def check_port(server, port):
    try:
        s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        s.settimeout(1)  # 设置超时时间为1秒
        s.connect((server, port))
        s.close()
        return True
    except Exception as e:
        return False

def check_servers_ports(servers, ports):
    status = {}
    for server in servers:
        hostname = ip_to_hostname.get(server,"Unknown") #获取主机名,如果位置则默认为"Unknown"
        status[server] = {'hostname':hostname}

        for port in ports:
            status[server][port] = check_port(server, port)
    return status

gauge_metric = Gauge('kafka_server_and_monitor_port', 'Current status of kafka server and monitor', ['server', 'port', 'hostname'])

def get_kafka_server_and_monitor_status():
    servers = list(ip_to_hostname.keys())
    ports = [9092, 9100, 9990, 9308]

    port_status = check_servers_ports(servers, ports)

    print("# HELP kafka_server_and_monitor_port Current status of kafka server and monitor.")
    print("# TYPE kafka_server_and_monitor_port Gauge")

    for server in port_status:
        for port, status in port_status[server].items():
            if port == 'hostname': #跳过主机名
                continue
            gauge_metric.labels(server=server, port=str(port),hostname=port_status[server]['hostname']).set(1 if status else 0)

if __name__ == "__main__":
    registry = CollectorRegistry(auto_describe=False)
    registry.register(gauge_metric) 
    start_http_server(1333,registry=registry)
    while True:
        get_kafka_server_and_monitor_status()
        time.sleep(60)

使用nohup在后台启动进程:

nohup python3.6 kafka_port_monitor.py >/dev/null 2>&1 &

最后查看监控指标是否正常输出

curl  http://localhost:1334/metrics
  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

weixin_49457994

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值