跳到主要内容

Kafka性能指标

集群指标

指标别名指标含义解释单位
版本
Partitions总数集群中所有节点Partition数之和
未复制分区总数集群中所有节点未复制分区数之和
离线分区总数集群中所有节点离线分区数之和
Controller存活数集群中Controller存活的数量
失败请求(生产者)集群中所有节点生产者失败请求的速率之和次/s
失败请求(消费者)集群中所有节点消费者失败请求的速率次/s
生产者流量集群中所有节点生产者流量之和Bytes/s
消费者流量集群中所有节点消费者流量之和Bytes/s
生产者QPS集群中所有节点生产者QPS之和次/s
消费者QPS集群中所有节点消费者QPS之和次/s
存活节点数集群中存活的节点数量
每秒流入消息数集群中所有节点流入消息数之和个/s
最大CPU利用率集群中所有节点CPU利用率最大值
最大内存利用率集群中所有节点内存利用率最大值
最大Heap区利用率集群中所有节点堆内存利用率最大值
最大Non-Heap区利用率集群中所有节点非堆内存利用率最大值
最大Minor GC次数集群中所有节点每分钟Minor GC次数最大值
最大Major GC次数集群中所有节点每分钟Major GC次数最大值
最大Minor GC时间集群中所有节点每分钟Minor GC时间
最大Major GC时间集群中所有节点每分钟Major GC时间

Broker指标

指标别名指标含义解释单位是否告警指标默认告警策略
CPU利用率%
内存利用率%
内存使用量Bytes
磁盘吞吐(Read)Bytes/s
磁盘吞吐(Write)Bytes/s
生产者流量Bytes
消费者流量Bytes
生产者QPS
消费者QPS
是否是Controller0:不是,1:是
Follower落后Leader最大消息量
Partition总数该节点分区总数
Leader分区总数
未复制分区总数
ISR扩大速率个/s
ISR收缩速率个/s
离线分区总数
Broker拒绝的消息Byte/s
生产者失败请求次/s
消费者失败请求次/s
生产者请求响应时间分位值request="Produce"ms
消费者请求响应时间分位值request="FetchConsumer"ms
fetch请求速率
失败的fetch请求数
zookeeper 连接断开速率客户端已断开与服务器的连接,并尝试重新连接。会话不一定过期。
zookeeper 会话过期速率
broker请求zk响应时间分位值

Topic指标

指标别名指标含义解释单位是否告警指标默认告警策略
生产者流量
消费者流量
生产者QPS
消费者QPS
Topic大小

ConsumperGroup指标

指标别名指标含义解释单位是否告警指标默认告警策略
生产者QPS
消费者QPS
Current-Offset
Log-End-Offset
Lag
消费组状态