基于SpringBoot Actuator与Prometheus自定义指标监控与性能优化实战指南

2025-08-06 10:37 开发作者：浅沫云归

业务场景描述

在电商平台的订单服务中，随着流量不断攀升，系统性能瓶颈逐渐暴露，常见问题包括接口响应时长波动大、服务并发压测不达预期以及关键业务调用链路缺少可观测性。为了精细化监控业务指标，如订单处理时长、并发提交量、下单失败率等，需要在Spring Boot应用中自定义指标，并推送到Prometheus进行存储和告警。

技术选型过程

Spring Boot Actuator：提供了一套可扩展的监控指标接口，内置常见JVM、HTTP等指标。
Micrometer：Actuator底层度量库，支持多种监控后端。
Prometheus：流行的时序数据库，易于抓取指标、支持多维度查询和告警规则。
Grafana：可视化展示和告警管理，支持PromQL语法。

选择Micrometer + Spring Boot Actuator作为指标采集层，由Prometheus周期性拉取指标并存储，Grafana用于展示与告警。

实现方案详解

python

项目依赖与配置

在pom.XML中加入依赖：

<dependency>
  <groupId>io.micrometer</groupId>
  <artifactId>micrometer-registry-prometheus</artifactId>
</dependency>
<dependency>
  <groupId>org.springframework.boot</groupId>
  <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

在application.yml中开启Actuator暴露端点：

management:
  endpoints:
    web:
      exposure:
        include: prometheus,health,metrics
  metrics:
    export:
      prometheus:
        enabled: true

Prometheus抓取配置

在Prometheus的scrape_configs中添加：

scrape_configs:
  - job_name: 'order-service'
    metrics_path: /actuator/prometheus
    static_configs:
      - targets: ['order-service-host:8080']

自定义业务指标

在代码中通过Micrometer的MeterRegistry注册自定义指标：

import io.micrometer.core.instrument.Counter;
import io.micrometer.core.instrument.Timer;
import io.micrometer.core.instrument.MeterRegistry;
import org.springframework.stereotype.Component;

@Component
public class OrderMetrics {
    private final Counter orderSuccessCounter;
    private final Counter orderFailureCounter;
    private final Timer orderProces编程客栈sTimer;

    public OrderMetrics(MeterRegistry registry) {
        this.orderSuccessCounter = Counter.builder("order_success_total")
            .description("成功下单总次数")
            .register(registry);
        this.orderFailureCounter = Counter.builder("order_failure_total")
            .description("下单失败总次数")
            .register(registry);
        this.orderProcessTimer = Timer.builder("order_process_duration")
            .description("订单处理时长")
            .publishPercentileHistogram()
            .register(registry);
    }

    public void recordSuccess() {
        orderSuccessCounter.increment();
    }

    public void recordFailur编程e() {
        orderFailureCounter.increment();
    }

    public Timer.Sample startTimer() {
        return Timer.start(orderProcessTimer.getId().getRegistry());
    }
}

在Service层使用：

@Service
public class OrderSejavascriptrvice {

    private final OrderMetrics metrics;

    public OrderService(OrderMetrics metrics) {
        this.metrics = metrics;
    }

    public void createOrder(OrderRequest req) {
        Timer.Sample sample = metrics.startTimer();
        try {
            // 业务逻辑：保存订单、调用支付等
            // ...
            metrics.recordSuccess();
        } catch (Exception e) {
            metrics.recordFailure();
            throw e;
  http://www.devze.com      } finally {
            sample.stop(metrics.orderProcessTimer);
        }
    }
}

Grafana展示与告警

在Grafana中新建数据源，类型选择Prometheus，指向Prometheus地址。

创建Dashboard，使用如下PromQL：

rate(order_success_total[1m]) 实时下单成功速率
histogram_quantile(0.95, sum(rate(order_process_duration_bucket[5m])) by (le)) P95订单处理时长

告警示例：当P95时长超过500ms或失败率高于1%时发送通知。

踩过的坑与解决方案

指标冲突：自定义指标名称与Actuator内置指标重名，导致注册失败。解决：为业务指标统一添加前缀，如order_。

直方图数据量大：Histogram默认bucket较多，Prometheus存储压力大。解决：合理配置bucket或使用摘要（Summary）类型。

HTTP拉取超时：Prometheus拉取时触发高并发，导致服务响应变慢。解决：调整Prometheus抓取并发量，或使用中间网关限流。

总结与最佳实践

合理设计业务指标名称与标签，避免冲突与cardinality爆炸。
按需开启Percentile Histogram，仅对关键接口使用。
Grafana Dashboard与告警策略结合SLO（服务等级目标）定义阈值。
在高并发环境中，组件拉取和注册指标操作需轻量，避免影响业务。
可扩展至Tracing与日志服务，构建完整的可观测性平台。

以上方案已在真实电商平台中验证，通过自定义监控指标定位性能瓶颈，P95时长从800ms降至350ms，系统稳定性显著提升。

到此这篇关于基于SpringBoot Actuator与Prometheus自定义指标监控与性能优化实战指南的文章就介绍到这了,更多相关SpringBoot Actuator与Prometheus监控内容请搜索编程客栈(www.devze.com)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程客栈(www.devze.com)！

继续阅读：SpringBoot Actuator SpringBoot Prometheus SpringBoot Prometheus自定义指标

基于SpringBoot Actuator与Prometheus自定义指标监控与性能优化实战指南

目录

业务场景描述

技术选型过程

实现方案详解

项目依赖与配置

Prometheus抓取配置

自定义业务指标

Grafana展示与告警

踩过的坑与解决方案

总结与最佳实践

更多精彩内容

精彩评论

最新开发

C++分布式语音识别服务实践方案

C#屏幕录制中遇到黑屏问题的原因和解决方法

C#利用.NET实现Word文档到HTML的高效转换

SpringBoot Maven的操作与配置图文教程

Spring Boot 整合第三方组件Redis、MyBatis、Kafka 实战案例指南

开发排行榜

springboot后端存储富文本内容的思路与步骤(含图片内容)

PyCharm运行python测试,报错“没有发现测试”/“空套件”的解决

return base64.b64encode(b).decode(

基于C语言实现钻石棋游戏的示例代码

Sublime Text 3解决中文乱码问题（实测可用）