跳到主要内容

疑似问题

功能概述

平台的AI算法引擎实时监测告警事件,并在有效观测问题窗口时间内将有相同根因的警报进行关联聚合,从而形成疑似问题。疑似问题提供横向和纵向的深入根因分析与影响分析。

概念解释

疑似问题有以下三种状态:

  • 打开:疑似问题创建后即处于"打开"状态。只要存在一个实体仍处于异常状态,问题就会保持"打开"状态。

  • 解决:当所有受影响的实体恢复正常(异常指标消失)且所有事件都已恢复时,问题状态变更为"解决"。

  • 关闭:当问题处于"解决"状态,且在观察窗口期(默认30分钟)内没有新事件聚合进来时,问题状态会被置为"关闭",表示问题已真正处理解决。

应用场景

当系统出现告警事件后,用于问题的识别、定位和分析,辅助帮助用户快速解决问题。

配置思路

  1. 进行告警配置。在告警配置中,检测方式选择“智能AI算法”,即会由告警事件生成疑似问题。
  2. 配置疑似问题的通知策略。

配置指导

疑似问题的告警规则配置请参考“告警管理 > 告警配置”说明文档。

疑似问题的通知策略配置请参考“告警管理 > 通知配置”说明文档。

疑似问题列表

疑似问题列表

区域信息项说明
左侧搜索栏状态打开、解决、关闭
类型可用性、错误、慢、资源、自定义事件
影响层级用户体验、应用、进程、Pod、主机、硬件、部署环境
图表统计打开数量当前查询窗口内,状态为"打开"的问题数量
解决数量当前查询窗口内,状态为"解决"的问题数量
关闭数量当前查询窗口内,状态为"关闭"的问题数量
柱形图统计状态的柱形趋势图
列表问题描述问题的简要说明
类型可用性、错误、慢、资源、自定义事件
状态打开、解决、关闭
根因根因实体
受影响实体所有告警的实体
受影响实体数量所有告警实体的数量
创建时间产生问题的时间
ID问题唯一标识

疑似问题详情

疑似问题详情

区域信息项说明
问题属性状态描述当前问题的状态
问题ID问题唯一标识
类型问题的类型
检测时间问题发生时间和问题持续时间之和
统计相关实体由告警实体以及自动异常检测实体组成
事件数告警产生的事件数量
问题路径根因传播路径图描述根因如何传播的请求级别的拓扑图
相关实体实体名称实体对象名称
实体类型实体的类型,如主机、应用、系统
根因根因实体
事件数实体产生的告警数量
事件事件描述告警事件的描述
事件指标趋势图告警事件的指标趋势图
事件元数据告警事件的属性