跳到主要内容

APO v1.3.0 更新:支持将第三方告警事件接入平台,统一关联分析告警事件

· 阅读需 3 分钟

cover 图

在 APO v1.3.0 版本中,我们引入了对第三方告警事件的全面支持,旨在为用户提供一个更为集成和高效的告警分析平台。此次更新允许用户将来自不同来源的告警信息统一接入APO平台,从而实现告警事件的集中管理和关联分析。

目前支持接入Prometheus(AlertManager)、Zabbix 和任意支持以 Webhook 发送的告警事件。告警接入后在服务详情中会自动将相关告警事件关联到服务上。同时在企业版的告警分析功能中,能够一键分析出告警相关的服务和影响的业务入口,通过大模型分析或人工深入分析快速对问题进行诊断。

1 图

在接入告警后,您可以在“服务详情”中的相关告警事件或“告警分析”功能中查看到告警内容。

更多变化请查看下面的更新日志。


更新日志

⚠️Breaking Change

对接外部单节点 VictoriaMetrics 的 Helm Charts 配置出现变化,如果您之前在安装APO时对接了外部VictoriaMetrics,请在使用helm upgrade升级前参考文档 “生产环境部署建议” 对已有helm values文件进行更新,否则会导致指标数据无法使用。

新增功能

  • 支持将外部告警接入APO平台,自动关联相关应用,并通过告警分析功能做告警诊断

功能优化

  • 支持将数据库/中间件告警关联到相关服务上
  • (企业版)优化单应用场景下大模型推理展示效果
  • (企业版)优化network_time类型延时报告分析逻辑,自动选择epoll或network中合适的分析方向

缺陷修复

  • (企业版)修复在离线环境中originx-copilot-ai组件持续重启的问题
  • (企业版)修复大模型根因推理在API限流时无法继续执行的问题
  • (企业版)修复确认根因无数据时页面无响应的问题

其他

  • 实验性功能:安装时支持使用外部 VictoriaMetrics 集群。

2 图