解读MySql深分页的问题及优化方案

2025-06-30 08:16 数据库作者：找不到、了

1、深分页

是对大型数据集进行分页查询时，尤其是当需要获取较后页的数据时，性能可能会受到影响。

传统的分页方法在数据量较大时，随着页数的增加，性能会迅速下降。

1.1. 传统分页

当数据进行查询的时候，需要进行以下过程：

解读MySql深分页的问题及优化方案

SELECT * FROM table_name ORDER BY id LIMIT offset, size;

limit：控制每页返回的记录数（size）。
offset：跳过前多少条记录（offset）。

1.2. 问题原因

1、扫描大量数据：

MpythonySQL需要跳过大量的数据行才能返回请求的数据。在数据量较大的表中，扫描的成本是巨大的，导致查询延迟增加。

2、锁竞争问题：

在使用OFFSET进行分页时，数据表的锁可能被频繁地获取和释放，尤其是在高并发的情况下，会导致锁竞争问题，进一步影响数据库的响应速度。

3、I/O瓶颈：

深分页查询会对I/O性能产生压力，因为每次查询都需要读取大量的磁盘数据，尤其是在使用MySQL的磁盘存储时，I/O操作会显著影响性能。

2、深分页的优化方案

2.1、索引介绍

在mysql中索引分为聚簇索引和非聚簇索引。

1、B+树索引的特点：

节点存储：B+树是一种自平衡的树结构，其中每个节点可以有多个子节点。
非叶子节点存储的是指向子节点的指针和分隔值，而叶子节点存储的是实际的数据记录或记录的指针。
顺序访问：叶子节点中的数据是按照索引列的顺序存储的，这使得范围查询非常高效。

2、聚簇索引和非聚簇索引：

聚簇索引（主键索引）的叶子节点直接存储行数据，而非聚簇索引（二级索引）的叶子节点存储的是主键值。

如下图所示：

解读MySql深分页的问题及优化方案

2.2、优化方案分类

1. 基于主键游标的分页

1、原理：

通过记录上一页的最后一个值（如主键或排序字段），作为下一页的起点，避免offset。

2、php适用场景：

数据有序且可唯一标识（如id或时间戳）。

3、实现步骤：

假设我们有一个users表，并且希望查询某一页的数据，传统的分页查询如下：

SELECT * FROM users ORDER BY id LIMIT 10 OFFSET 1000;


使用游标分页的查询如下：

SELECT * FROM users WHERE id > ? ORDER BY id LIMIT 10;

4、优点：

避免offset，直接定位到起始位置。查询效率稳定，不受页数影响。

5、缺点：

无法直接跳转到任意页。

需要业务层维护“游标”（如上一页最后一个记录的id）。

2. 延迟关联

1、原理：

先通过子查询获取主键，再通过主键关联原表获取完整数据。

2、适用场景：

需要关联多表或查询非主键字段的场景。

3、实现步骤：

-- 1. 先查询主键（使用覆盖索引）
SELECT id FROM table_name ORDER BY id LIMIT 99990, 10;

-- 2. 通过主键关联原表获取完整数据
SELECT t.* 
FROM table_name t 
JOIN (
    SELECT id FROM table_name ORDER BY id LIMIT 99990, 10
) AS tmp ON t.id = tmp.id;

4、优点：

减少扫描数据量，尤其是当主键字段有索引时。

5、缺点：

需要额外的子查询和 JOIN 操作。

3. 覆盖索引

1、原理：

创建包含查询所需字段的复合索引，避免回表操作。

2、适用场景：

查询字段较少且可被索引覆盖。

3、实现步骤：

-- 创建覆盖索引（假设按 id 排序）
CREATE INDEX idx_cover ON table_name (id, name, age);

-- 使用覆盖索引查询（无需回表）
SELECT id, name, age FROM table_name ORDER BY id LIMIT 100000, 10;

4、优点：

索引本身包含所需数据，减少 I/O。

5、缺点：

索引占用额外存储空间。

4. 分区表

1、原理：

将大表按规则（如按时间或范围）拆分为多个分区，查询时只扫描相关分区。

2、适用场景：

数据可按某种规则分区（如按时间）。

3、实现步骤：

1、按时间范围分区

按时间范围分区
CREATE TABLE orders (
    id BIGINT PRIMARY KEY,
    user_id INT,
    create_time DATETIME
)
PARTITION BY RANGE (YEAR(create_time)) (
    PARTITION p2022 VALUES LESS THAN (2023),
    PARTITION p2023 VALUES LESS THAN (2024),
    PARTITION p2024 VALUES LESS THAN (2025)
);


-- 查询2023年的订单，分页
SELECT * FROM orders 
WHERE create_time BETWEEN '2023-01-01' AND '2023-12-31'
ORDER BY create_time DESC 
LIMIT 1000000, 20;


优化效果：仅扫描 p2023 分区，避免全表扫描。

2、按 ID 范围分区

CREATE TABLE users (
    id BIGINT PRIMARY KEY,
    name VARCHAR(100)
)
PARTITION BY RANGE (id)php (
    PARTITION p1 VALUES LESS THAN (1000000),
    PARTITION p2 VALUES LESS THAN (2000000),
    PARTITION p3 VALUES LESS THAN (MAXVALUE)
);


-- 查询 ID > 1000000 的用户，分页
SELECT * FROM users 
WHERE id > 1000000 
ORDER BY id 
LIMIT 20;

仅扫描 p2 和 p3 分区，跳过 p1。

4、优点：

显著减少扫描数据量。

5、缺点：

分区管理复杂，不适合频繁修改分区规则的场景。

5. 缓存机制

1、原理：

对频繁访问的分页结果进行缓存（如 Redis），减少数据库查询。

2、适用场景：

数据更新频率低，分页请求频繁。

3、实现步骤：

使用缓存中间件（如 Redis）存储分页结果。
对于冷数据或过深分页，直接返回缓存或提示用户跳转限制。

4、优点：

显著降低数据库压力。

5、缺点：

数据实时性要求高的场景不适用。

6. 业务层优化

1、限制最大页数：

如限制用户最多查看前 100 页。

2、滑动窗口分页：

允许用户通过“上一页/下一页”滑动访问，而非跳转到任意页。

3、预加载数据：

在用户浏览当前页时，预加载下一页数据。

性能对比

解读MySql深分页的问题及优化方案

3、总结

深分页是 MySQL javascript处理大数据量时的常见性能瓶颈。优化的核心在于减少扫描数据量和避免 OFFSET 的全表扫描。

根据业务需求选择合适的方案：

优先推荐：游标分页或延迟关联（适合大多数场景）。
补充方案：覆盖索引、分区表或缓存机制（针对特定需求）。
业务层配合：限制分页深度或改用滑动窗口。

通过合理设计索引、查询语句和分页逻辑，可以显著提升深分页的性能，避免 MySQL 在大数据量下的性能退化。

编程

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程客栈(www.devze.com)。

解读MySql深分页的问题及优化方案

目录

1、深分页

1.1. 传统分页

1.2. 问题原因

2、深分页的优化方案

2.1、索引介绍

2.2、优化方案分类

1. 基于主键游标的分页

2. 延迟关联

3. 覆盖索引

4. 分区表

5. 缓存机制

6. 业务层优化

3、总结

更多精彩内容

精彩评论

最新数据库

SQL大表关联优化全攻略及常见问题

深入理解Mysql中页分裂、合并的问题

SQL注入之报错注入实战演练(适合新手入门)

解决Navicat查询到的数据不能修改问题

MySQL通过传输表空间实现大表ibd文件的物理迁移的具体方案

数据库排行榜

Hadoop Key Management Server (KMS)配置及测试

spark报错ERROR ObjectStore: Version information found in metastore differs 2.1.0 from expected schema version 1.2.0. Schema verififcation is disabled hive.metastore.schema.verification so setting version.

Navicat连接Oracle数据库的详细步骤与注意事项

redis-cluster集群调优之cluster-require-full-coverage参数

解决Navicat远程连接MySQL出现 10060 unknow error的方法