使用python对kafka offset 进行监控

最新推荐文章于 2022-07-25 17:30:40 发布

weixin_33812433

最新推荐文章于 2022-07-25 17:30:40 发布

阅读量2.3k

点赞数 1

文章标签：大数据 python 数据库

原文链接：https://my.oschina.net/ktlb/blog/863308

版权

为什么80%的码农都做不了架构师？>>>

1.由于kafka 的offset存储方式改变,支持之前的zookeeper和现在的kafka内部存储机制
2.实在没找到怎么获取kafka 内部存储的消费组,所以不能和zk里一样,能全部查出消费组,
配置需要监控的消费组

配置如下

# 监控的topic
topics = ['test_topic']
# 要监控的groupid
monitor_group_ids = ['consumer_1']
# broker-list
servers = 'localhost:9092'
# mysql args
dbargs = {'user': 'root', 'password': '1234', 'host': 'localhost', 'database': 'test'}
# 监控数据上报间隔 秒
time_interval = 2.5
# 历史全量数据上报间隔
history_time_interval = 5 * 60

# -*- coding:utf-8 -*-
import time

import sys

from kafka.client import KafkaClient
from kafka.protocol.commit import OffsetFetchRequest_v1, OffsetFetchResponse_v1, OffsetFetchRequest_v0, \
    OffsetFetchResponse_v0
from kafka.protocol.offset import OffsetRequest_v0, OffsetResponse_v0
from mysql import connector
from sqlalchemy.engine import create_engine
from sqlalchemy.orm import create_session

from monitor_constants import *

duration = 0
client = None
conn = None
partition_cache = {}
brokers_cache = []
kafka_type = []
zk_type = []
insert_sql = ("INSERT INTO consumer_monitor "
              "(group_id, topic, `partition`, `offset`, logsize, create_time) "
              "VALUES (:group_id,:topic,:partition,:offset,:logsize,:create_time)")
history_insert_sql = ("INSERT INTO consumer_monitor_history "
                      "(group_id, topic, `partition`, `offset`, logsize, create_time) "
                      "VALUES (:group_id,:topic,:partition,:offset,:logsize,:create_time)")
select_sql = ("select count(1) "
              "from consumer_monitor "
              "where group_id=:group_id and topic=:topic and `partition`=:partition")
update_sql = ("update consumer_monitor "
              "set `offset`=:offset,logsize=:logsize,create_time=:create_time "
              "where group_id=:group_id and topic=:topic and `partition`=:partition")


def get_brokers():
    if not brokers_cache:
        brokers = client.cluster.brokers()
        if brokers:
            brokers_cache.extend([x.nodeId for x in brokers])
    return brokers_cache


def get_partitions(topic):
    if not partition_cache or topic not in partition_cache:
        partitions = client.cluster.available_partitions_for_topic(topic)
        if partitions:
            partition_cache[topic] = [x for x in partitions]
        else:
            return []
    return partition_cache[topic]


def get_logsize():
    """
        获取topic 下每个partition的logsize(各个broker的累加)
    :return:
    """
    tp = {}  # topic : partition_dict
    brokers = get_brokers()
    for topic in topics:
        partitions = get_partitions(topic)
        pl = {}  # partition : logsize
        for broker in brokers:
            # 这里取笛卡尔积可能有问题,但是不影响parse中解析了
            for partition in partitions:
                client.send(broker, OffsetRequest_v0(replica_id=-1, topics=[(topic, [(partition, -1, 1)])]))
                responses = client.poll()
                pdict = parse_logsize(topic, partition, responses)
                append(pl, pdict)
        tp[topic] = pl
    return tp


def append(rdict, pdict):
    if rdict:
        # 已经有记录,累加
        for k, v in pdict.items():
            if k in rdict:
                rdict[k] = rdict[k] + v
            else:
                rdict[k] = v
    else:
        rdict.update(pdict)


def parse_logsize(t, p, responses):
    """
        单个broker中单个partition的logsize
    :param responses:
    :param p:
    :param t:
    :return:
    """
    for response in responses:
        if not isinstance(response, OffsetResponse_v0):
            return {}
        tps = response.topics
        topic = tps[0][0]
        partition_list = tps[0][1]
        partition = partition_list[0][0]
        # 异步poll来的数据可能不准
        if topic == t and partition == p and partition_list[0][1] == 0:
            logsize_list = partition_list[0][2]
            logsize = logsize_list[0]
            return {partition: logsize}
    return {}


def parse_offsets(t, responses):
    dr = {}
    for response in responses:
        if not isinstance(response, (OffsetFetchResponse_v1, OffsetFetchResponse_v0)):
            return {}
        tps = response.topics
        topic = tps[0][0]
        partition_list = tps[0][1]
        if topic == t:
            for partition_tunple in partition_list:
                if partition_tunple[3] == 0:
                    offset = partition_tunple[1]
                    dr[partition_tunple[0]] = offset
    return dr


def get_offsets():
    # {gid: dict}
    gd = {}
    for gid in monitor_group_ids:
        td = {}  # {topic:dict}
        for topic in topics:
            pd = {}  # {partition:dict}
            for broker in get_brokers():
                partitions = get_partitions(topic)
                if not partitions:
                    return {}
                else:
                    responses = optionnal_send(broker, gid, topic, partitions)
                    dr = parse_offsets(topic, responses)
                    append(pd, dr)
            td[topic] = pd
        gd[gid] = td
    return gd


def optionnal_send(broker, gid, topic, partitions):
    if gid in kafka_type:
        return kafka_send(broker, gid, topic, partitions)
    elif gid in zk_type:
        return zk_send(broker, gid, topic, partitions)
    else:
        responses = zk_send(broker, gid, topic, partitions)
        dct = parse_offsets(topic, responses)
        if is_suitable(dct):
            zk_type.append(gid)
            return responses
        responses = kafka_send(broker, gid, topic, partitions)
        dct = parse_offsets(topic, responses)
        if is_suitable(dct):
            kafka_type.append(gid)
        return responses


def is_suitable(dct):
    for x in dct.values():
        if x != -1:
            return True


def kafka_send(broker, gid, topic, partitions):
    client.send(broker, OffsetFetchRequest_v1(consumer_group=gid, topics=[(topic, partitions)]))
    return client.poll()


def zk_send(broker, gid, topic, partitions):
    client.send(broker, OffsetFetchRequest_v0(consumer_group=gid, topics=[(topic, partitions)]))
    return client.poll()


def initdb():
    try:
        config_url = 'mysql+mysqlconnector://' + dbargs['user'] + ':' + dbargs['password'] + '@' + dbargs[
            'host'] + '/' + dbargs['database'] + '?charset=utf8'
        engine = create_engine(config_url, echo=False, pool_recycle=4)
        return create_session(bind=engine, autocommit=False)
    except connector.Error as e:
        print e
        sys.exit(1)


def exec_sql(sql, param):
    try:
        result = conn.execute(sql, param)
        conn.commit()
        conn.close()
        return result.rowcount
    except Exception as e:
        try:
            conn.rollback()
            conn.close()
        except Exception as ex:
            print ex
        print e


def store_db(param):
    dr = {'group_id': param[0], 'topic': param[1], 'partition': param[2], 'offset': param[3], 'logsize': param[4],
          'create_time': param[5]}
    global duration
    if duration >= history_time_interval:
        exec_sql(history_insert_sql, dr)
        duration = 0
    exist = exec_sql(select_sql, {'group_id': param[0], 'topic': param[1], 'partition': param[2]})
    if exist and exist != 0:
        exec_sql(update_sql, dr)
    else:
        exec_sql(insert_sql, dr)


def do_task():
    offset_dict = get_offsets()
    logsize_dict = get_logsize()
    for gk, gv in offset_dict.items():
        for tk, tv in gv.items():
            for pk, pv in tv.items():
                if logsize_dict and tk in logsize_dict:
                    dr = logsize_dict[tk]  # partition:logsize
                    if dr and pk in dr:
                        param = (gk, tk, pk, pv, dr[pk],
                                 time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time())))
                        store_db(param)


if __name__ == "__main__":
    conn = initdb()
    client = KafkaClient(bootstrap_servers=servers, request_timeout_ms=3000)
    while True:
        do_task()
        time.sleep(time_interval)
        duration += time_interval

转载于:https://my.oschina.net/ktlb/blog/863308