KL个人博客 首页>>2025-03

OpenTelemetry Collector 节点宕机场景下的排查与优化

前言 本文同步发布在 OSC : https://my.oschina.net/klblog/blog/17885767 OpenTelemetry Collector 是 OpenTelemetry 的核心组件,但在底层基础设施(如 Kubernetes 节点)故障时,可能暴露出阻塞或延迟问题。本文通过一次因 Sampling 服务节点宕机引发的故障,结合代码分析其原因,并提供临时和长期解决方案。 问题描述 一天,收到告警,OpenTelemetry 出现 Exporter Trace 异常的情况,具体表现为: OpenTelemetry Collect...

阅读全文 »