架构

最后于 2025年4月25日 更新

架构图

architecture

APO 的整体架构按照层次可以分成以下几层：

APO 主要包含三部分组件，APO OneAgent、APO Proxy 与 APO Server：

下图给出了向导式可观测性产品数据采集层、数据处理层与存储层的核心数据流图：

data-flow

下面分别对数据流图中的组件功能进行介绍。

nginx-proxy 用于接收各监控节点发送的回溯采样逻辑 Traces 和 Profilings，并统一转发到服务端
otel-collector 用于采集 Kubernetes 事件；用于接收各监控节点的数据并转发到服务端；用于在指标中补充 Kubernetes 元信息

apo-collector 用于收集回溯采样逻辑 Traces 和 Profilings，分析数据识别链路故障，并将数据存储到 ClickHouse中
otel-collector-gateway 在服务端统一接收 Traces、Metrics、Logs 数据
jaeger-collector 用于接收 Traces 数据并转换为 Jaeger 的数据格式
remote-storage 用于将 Jaeger 数据格式的 Traces 存储到 ClickHouse 中。Jaeger 1.58 不支持将链路数据直接写入 ClickHouse 并查询出来，APO修改了 Jaeger RemoteStorage，按照 Jaeger Clickhouse 项目的格式写入 clickhouse 并查询链路，目前集成的 Jaeger 版本为1.58
jaeger-query 用于查询 Traces 数据
ClickHouse 是一个用于在线分析处理 (OLAP) 的开源列式数据库管理系统 (DBMS)。它专为高速查询和数据分析而设计，能够在单个服务器或群集上运行，并支持实时数据流处理。ClickHouse 能够处理大量结构化数据，并且可以在几秒内完成对数十亿行数据的查询。
VictoriaMetrics 是一款用于监控和时序数据处理的时序数据库，特别适合大规模监控场景。它的主要目标是提供高性能的时间序列存储与检索能力，同时保持较低的资源消耗。

出于可读性考虑，APO Server 使用的部分组件没有展示在数据流图中，这里给出其他组件的描述：