跳到主要内容

业务系统

业务系统,是指共同完成某一类特定业务(例如电商系统,OA系统,电子邮件系统等)的一组应用的集合。业务系统中可以包含一到多个应用,每个应用只能归属于一个业务系统。

业务系统列表

业务系统列表页显示所有监控到的业务系统及其相关的性能指标(指标统计时不包括后台任务),单击业务系统名称可进入业务系统详情页。支持创建、编辑和删除业务系统,当业务系统7天无数据时支持删除业务系统。

注意:业务系统的响应时间P50、平均响应时间、吞吐率、请求次数、慢次数、错误率、错误次数、异常次数等性能指标的仅统计Web请求,不统计后台任务。

system-list

创建业务系统

用户可以将属于共同完成同一个业务的相关应用加入新建的业务系统中。目前支持两种方式创建业务系统,分别是通过控制台创建和通过配置文件创建。

控制台创建

  1. 在左侧导航栏中单击业务系统,进入业务系统列表页面。
  2. 单击右上角的新建业务系统按钮。
  3. 在弹出的创建新业务系统对话框中进行配置。
  4. 单击保存完成创建。

配置文件创建

用户可通过UniAgent的oneagent.conf配置文件,在控制台中自动创建业务系统,该UniAgent默认将上传数据到此业务系统。

创建方式:在UniAgent第一次启动前,修改文件/opt/tingyun-oneagent/conf/oneagent.conf中default_business_system配置项。默认值为default。如果填写的是一个新的业务系统,将新创建并展示在业务系统列表或拓扑中,以及UniAgents管理>新增页面的业务系统下拉菜单中;如果填写的是一个已存在的业务系统,可指定UniAgent默认上传数据的业务系统。

UniAgent启动后,如果您想修改探针所属的业务系统,可在控制台中直接修改即可。

拓扑图

业务系统页面的左上角单击拓扑页签,可以切换到业务系统全局拓扑图页面。业务系统全局拓扑以图标和连线的形式展示各个业务系统之间复杂的调用关系,并展示相关性能指标,当出现性能问题时能帮助用户迅速定位故障所在。 业务系统拓扑界面包括:拓扑图展示区和右上角的操作。如下图所示:

拓扑图

默认展示所有业务系统之间的相互调用关系,包括Web请求和后台任务的调用。 system-topology

  • 图标的颜色代表疑似问题,正常节点显示为蓝色,问题节点显示为黄色,根因节点显示为红色。

  • 单击业务系统的图标显示业务系统的详情,可查看本业务系统的拓扑图、疑似问题、分布式追踪、基本信息等内容。

  • 单击连线会以抽屉的形式展示业务系统与业务系统之间的上下游服务调用信息和追踪信息。

连线详情

默认显示业务系统和业务系统之间的调用分析、分布式追踪。

调用分析

默认显示上游业务系统的应用、下游业务系统的应用及相关指标,指标数据为上游服务调用下游服务时下游服务的数据。 system-topology-line-detail

  • 上游服务和下游服务均支持按应用、请求、实例分组,当上游服务选择按请求分组时,调用分析列表将按请求维度显示数据。
  • 展开显示平均响应时间、错误率和吞吐率的趋势图以及下游服务的追踪。
分布式追踪

显示上游业务系统调用下游业务系统时,下游业务系统的分布式追踪列表。 system-topology-line-trace

操作

通过各个按钮对拓扑图进行操作。

  • 设置:
    • 隐藏孤立的节点
  • 全屏
  • 图例

业务系统概览

业务系统概览页为您提供业务系统的全面性能视图,包括标签、属性、疑似问题、指标和关系等信息。通过该页面,您可以快速了解业务系统的性能趋势以及上下游调用关系,帮助您快速定位问题并优化业务系统性能。

system-overview

指标

指标模块显示业务系统的关键指标,包括:响应时间、错误率和吞吐率的指标趋势图,支持单击全部指标查看业务系统的全部指标的趋势图。

system-overview-metric

关系

关系模块显示当前业务系统的调用关系,从左到右依次是调用者、当前业务系统的纵向依赖、调用的下游的业务系统。

  • 调用者区域:显示调用当前业务系统的业务系统及个数。单击调用者业务系统时,下方会显示调用者的业务系统列表。单击列表的业务系统名称可查看该业务系统的概览。
  • 当前业务系统:显示当前业务系统下的应用、请求、容器和主机。单击卡片,下方显示对应的实体列表。
  • 下游的业务系统:显示当前业务系统调用的业务系统及个数。单击调用者业务系统时,下方会显示调用者的业务系统列表。单击列表的业务系统名称可查看该业务系统的概览。

system-overview-topology

业务系统拓扑图

业务系统拓扑图展示当前业务系统中活跃应用、服务组件以及其他相关的业务系统之间的逻辑调用关系,以及前端浏览器、Mobile、Web、Mp对应用的访问情况。每个应用、服务组件和终端用户都以图标形式展示,并以带有箭头的连线来展示应用之间、应用与服务组件以及应用与业务系统等等之间的调用关系。 system-detail-topology

  • 图标的颜色代表疑似问题,正常节点显示为蓝色,问题节点显示为黄色,根因节点显示为红色。

  • 单击节点的图标显示节点的详情,可查看指标、疑似问题、分布式追踪、基本信息等内容。

  • 单击连线会以抽屉的形式展示应用与应用之间、应用与服务组件以及应用与业务系统等等之间的上下游服务调用信息、错误分析和追踪信息。

连线详情

默认显示应用与应用之间、应用与服务组件以及应用与业务系统等等之间调用关系。

调用分析

默认显示上游应用、下游应用及相关指标,指标数据为上游服务调用下游服务时下游服务的数据。 system-detail-topology-line-call

  • 上游服务和下游服务均支持按应用、请求、实例分组,当上游服务选择按请求分组时,调用分析列表将按请求维度显示数据。
  • 展开显示平均响应时间、错误率和吞吐率的趋势图以及下游服务的追踪。

分布式追踪

system-detail-topology-line-trace 显示上游服务调用下游服务时,下游服务的分布式追踪列表。

错误分析

显示上游服务调用下游服务时,下游服务的错误详情,包括错误信息、message、影响的请求和错误追踪列表。 system-detail-topology-line-error

操作

通过各个按钮对拓扑图进行操作。

  • 设置:
    • 隐藏孤立的节点
    • 合并 Database
    • 合并 MQ
    • 合并 HTTP 服务
    • 合并 RPC 服务
    • 合并 GenAI
    • 合并其他业务系统的应用
    • 展示节点数
  • 全屏
  • 图例
注意:

拓扑图调用关系的绘制和指标均依赖于调用者应用采集的数据,并根据下游服务返回的 X-Tingyun-Data 响应头的数据来串联调用关系和计算指标。

  • 关系发现:系统通过解析调用者Span的内容绘制调用关系。

  • 指标计算:连线上的所有指标均根据调用者Span的数据进行聚合计算,不是下游服务的性能指标。

  • 异常情况:

    • 分布式追踪的数据比调用分析的请求次数多,可能原因:
      • 下游服务部分请求未返回tx_Data时,连线和调用分析缺少部分性能数据,分布式追踪列表的数据是完整的。
    • 分布式追踪的数据比调用分析的请求次数少,可能原因:
      • 开启了采样功能
      • 探针熔断
      • 开启了事务过滤功能
    • 应用调用应用,调用分析上游服务选择请求维度时无数据或缺少数据,可能原因:
      • 请求是RPC调用、MQ消费者
    • 如果时间选择最近XX,指标数据和追踪数据可能由于入库时间有偏差导致数据不一致。
    • 下游服务发生错误时,拓扑图连线可能没有错误,可能原因:
      • 下游服务响应结束后发生错误
    • 连线有错误,下游服务未发生错误,可能原因:
      • 下游服务配置了忽略错误

疑似问题

疑似问题页面显示业务系统的疑似问题,包括问题描述、影响范围和可能原因等信息,帮助用户快速识别潜在故障。单击问题ID可查看问题的根因、影响范围等信息。

基本信息

基本信息页面展示业务系统的标签和属性。标签模块显示标签的key和value,并支持用户添加或删除标签。属性模块展示业务系统的属性信息,如名称、别名等信息。

system-info