APO v1.3.0 更新:支持将第三方告警事件接入平台,统一关联分析告警事件
· 阅读需 3 分钟
在 APO v1.3.0 版本中,我们引入了对第三方告警事件的全面支持,旨在为用户提供一个更为集成和高效的告警分析平台。此次更新允许用户将来自不同来源的告警信息统一接入APO平台,从而实现告警事件的集 中管理和关联分析。
目前支持接入Prometheus(AlertManager)、Zabbix 和任意支持以 Webhook 发送的告警事件。告警接入后在服务详情中会自动将相关告警事件关联到服务上。同时在企业版的告警分析功能中,能够一键分析出告警相关的服务和影响的业务入口,通过大模型分析或人工深入分析快速对问题进行诊断。
在接入告警后,您可以在“服务详情”中的相关告警事件或“告警分析”功能中查看到告警内容。
更多变化请查看下面的更新日志。
更新日志
⚠️Breaking Change
对接外部单节点 VictoriaMetrics 的 Helm Charts 配置出现变化,如果您之前在安装APO时对接了外部VictoriaMetrics,请在使用helm upgrade升级前参考文档 “生产环境部署建议” 对已有helm values文件进行更新,否则会导致指标数据无法使用。
新增功能
-
支持将外部告警接入APO平台,自动关联相关应用,并通过告警分析功能做告警诊断
功能优化
- 支持将数据库/中间件告警关联到相关服务上
- (企业版)优化单应 用场景下大模型推理展示效果
- (企业版)优化network_time类型延时报告分析逻辑,自动选择epoll或network中合适的分析方向
缺陷修复
- (企业版)修复在离线环境中originx-copilot-ai组件持续重启的问题
- (企业版)修复大模型根因推理在API限流时无法继续执行的问题
- (企业版)修复确认根因无数据时页面无响应的问题
其他
- 实验性功能:安装时支持使用外部 VictoriaMetrics 集群。