OpenTelemetry Collector处理器

简介

OpenTelemetry Collector处理器（Processor）是Collector流水线中的核心组件，负责对接收到的遥测数据（如指标、日志、跟踪）进行转换、过滤或增强。它们位于接收器（Receiver）和导出器（Exporter）之间，提供了一种灵活的数据处理机制。

为什么需要处理器？

处理器可以解决以下问题：

数据清洗：过滤掉不需要的字段或数据。
数据丰富：添加上下文信息（如环境标签）。
数据转换：修改格式或聚合指标。

核心处理器类型

1. 批处理处理器（Batch）

将多个数据点打包成批次，减少导出调用次数。

processors:
  batch:
    timeout: 5s
    send_batch_size: 100

2. 属性处理器（Attributes）

修改数据的属性（键值对）：

processors:
  attributes:
    actions:
      - key: environment
        value: production
        action: insert

输入：{"traceId": "abc", "attributes": {"user": "Alice"}}
输出：{"traceId": "abc", "attributes": {"user": "Alice", "environment": "production"}}

3. 过滤处理器（Filter）

根据条件过滤数据：

processors:
  filter:
    logs:
      exclude:
        match_type: strict
        resource_attributes:
          - key: env
            value: debug

实际案例：电商应用监控

假设我们需要监控一个电商服务：

过滤掉健康检查的请求
为所有请求添加 service.name 属性
批量发送数据到后端

processors:
  filter:
    spans:
      exclude:
        match_type: strict
        attributes:
          - key: http.path
            value: /healthcheck
  attributes:
    actions:
      - key: service.name
        value: checkout-service
        action: upsert
  batch:
    timeout: 10s

处理器流水线示例

常见问题

处理器顺序很重要！

处理器的执行顺序由配置文件中的声明顺序决定。例如，先过滤再批量处理通常比反过来更高效。

总结

处理器是OpenTelemetry Collector的数据处理单元
常用类型包括批处理、属性修改和过滤
可通过组合处理器实现复杂的数据流水线

延伸学习

尝试在本地Collector配置中添加一个属性处理器
使用 logging 导出器调试处理器效果
官方文档：Processor README

简介​

核心处理器类型​

1. 批处理处理器（Batch）​

2. 属性处理器（Attributes）​

3. 过滤处理器（Filter）​

实际案例：电商应用监控​

处理器流水线示例​

常见问题​

总结​

延伸学习​

简介