跳到主要内容

Collector配置

Collector容量规划

部署Collector的主机推荐配置如下:

  • CPU:4 Core及以上
  • 物理内存:8GB及以上

单个Collector每秒可以处理的trace数量和trace内span的数量有关系,单个trace内span数量越多,需要的计算资源就越多。部署在4 Core、8GB机器上的Collector通常可以承受4000TPS的trace数据。

CPU使用情况还和Collector相关的应用实例数量有关系,应用实例数量越多,需要的计算资源就越多。

在实践中,我们推荐按照以下公式计算需要部署的Collector数量:

Collector数量 = Max(应用实例总数/100, 一天内TPS的峰值/4000) + 1

主配置文件路径: /opt/tingyun-collector/conf/Collector.yaml

Collector中包含APM Collector、Infra Collector 和 Guanyun Collector 三个大的组件,在特殊场景下,您可能不需要使用部分功能,此时可以将其禁用。

## 是否启用INFRA
infra_enabled

## 是否启用APM
apm_enabled

## 是否启用观云,接入Zabbix、Prometheus、OpenTelemetry、云厂商监控等
guanyun_enabled

## APM Collector的JVM参数
apm_jvm_args

修改后,需执行 sudo systemctl restart tingyun-collector 重启Collector。

说明

  • 禁用Infra Collector将会导致Collector无法通过报表自动升级。

开启APM trace尾采时的注意事项

  • 相同部署环境下所有Collector都应该升级到4.2及以上版本。

  • 仅适用于相同部署环境Collector,不支持一个请求链路跨越了不同部署环境的场景。

  • 所有Collector之间需要互传尾采信息,需确认开通Collector之间的防火墙策略。

  • trace会临时落盘到本地文件文件/opt/tingyun-collector/tail,需要比较高的硬盘、CPU和内存资源。

    尽量使用SSD硬盘并预留10G以上硬盘空间。或将文件映射到内存来提高性能: sudo mount -t tmpfs -o size=4G tmpfs /opt/tingyun-collector/tail

  • 只要尾采窗口内任何一个trace被采样策略保留,那么此trace相关的链路上所有trace均被保留。

  • 尾采窗口为1分钟,链路请求时间差距超过1分钟的trace不再遵循尾采策略。

  • trace上报会增加3分钟延迟。

APM Collector的其他配置

APM Collector的配置在Collector根目录下的 ./conf/apm/collector.properties 文件中。

修改APM日志级别为debug:log.level=debug

当Collector的可用CPU超过4 Core时,建议将 trace.consumer_worker 设置为CPU核数。

Infra Collector的其他配置

Infra Collector的配置在Collector根目录下的 ./conf/infra/ 目录中,通常情况无需修改。

Guanyun Collector的其他配置

Guanyun Collector的主配置在Collector根目录下的 ./conf/guanyun/collector.yaml 文件中,通常情况无需修改。

Guanyun Collector的接入数据配置在Collector根目录下的 ./conf.d/,需要根据不同的接入需求,配置不同的配置文件。

修改Guanyun日志级别为debug

exporters:
debug:
verbosity: detailed

查看日志

  • Collector服务的日志

    路径 /opt/tingyun-collector/logs/watchdog.log

    正常情况应该出现 heartbeat 心跳日志

    Sending heartbeat       {"url": "http://10.128.8.61:80/apm/data/collectorHeartbeat", "data": "{\"CollectorId\":\"0fc908dfe7274aeab40aa0686ad3e511\",\"ZoneName\":\"zhenzh-vm\",\"CollectorName\":\"10.0.2.15\",\"Ip\":\"10.0.2.15\",\"Version\":\"4.2.0-3\""}
  • APM Collector的日志

    路径 /opt/tingyun-collector/logs/apm/collector.log

    正常情况应该出现 heartbeat 心跳日志

    Send 1483 bytes to http://10.128.8.61:80/apm/data/heartbeat  {"disabled":false,"name":"10.0.2.15","version":"20251010",
  • Infra Collector的日志

    路径 /opt/tingyun-collector/logs/infra/infra_collector.log

    正常情况应该出现 heartbeat 心跳日志

    POST request to http://10.128.8.61:80/infra/data/service/sync/heartBeat with params {\"address\":\"10.0.2.15:27666\",\"apmPort\":\"27665\",\"collectorName\"
  • Guanyun Collector的日志

    路径 /opt/tingyun-collector/logs/guanyun/collector.log

    仅需要在配置了接入数据源的情况下才需要查看日志

    接入数据源后应该出现发送Metric数据的日志

    info    Metrics {"resource": {"service.instance.id": "438fbe51-4f17-43a0-b8c4-eb50b91589d3", "service.name": "guanyun-collector", "service.version": "4.2.0"}, "otelcol.component.id": "debug", "otelcol.component.kind": "exporter", "otelcol.signal": "metrics", "resource metrics": 1, "metrics": 24, "data points": 43}