📅 2023-06-14
1. 可观测性
#
OpenTelemetry Collector提供了多种方法来评估其自身的健康状况以及如何排除故障。
1.1 日志
#
日志对于识别问题非常有帮助。始终从检查日志输出并查找潜在问题开始。日志的级别默认为INFO
。
在配置中设置日志级别:
1service:
2 telemetry:
3 logs:
4 level: "debug"
1.2 Metrics
#
OTEL Collector的Prometheus指标在本地通过端口8888
和路径/metrics
公开。并可以通过配置文件中的service.telemetry.metrics.address
进行配置。
...📅 2023-06-13
1. 基于OpenTelemetry的可观测性方案
#
最近将一个项目的可观测性方案从Logs(ElasticSearch,Fuentbit,Kibana), Traces(Jaeger+OpenTracing)迁移到了OpenTelemetry。此项目由多个微服务组成,部署在一个Kubernetes集群中。
OpenTelemetry Collector由OpenTelemetry K8S Operator管理,并以DaemonSet的形式部署在Kubernetes集群的各个节点上。即每个K8S节点上都有一个OTEL Collector Agent进程负责收集并处理本节点上微服务Pod实例的Logs, Traces, Metrics数据,并将Logs, Traces数据发送到后端的日志存储(Loki或ES)、Traces数据存储(Jaeger或Tempo),同时将Metrics数据暴露给Prometheus。
...