在电商商品列表查询、日志批量导出、大数据报表统计等场景中,深度分页是高频需求,但Elasticsearch默认的from+size分页方式,在from值超过10000时不仅会触发max_result_window限制报错,还会因协调节点需聚合海量数据导致内存溢出、查询超时。而Elasticsearch 深度分页 Scroll 与 SearchAfter正是为解决这一痛点而生:Scroll适合非实时批量数据导出,SearchAfter适配实时用户前台分页,二者从机制层面规避了from+size的性能瓶颈。鳄鱼java作为专注Elasticsearch实战的技术平台,已帮助数十家企业落地这两种方案,将深度分页的查询效率提升了90%以上。
一、为什么from+size撑不起Elasticsearch深度分页?

Elasticsearch的from+size分页原理是:每个分片需查询出前from+size条数据,将所有分片的结果拉取到协调节点后,合并排序再取第from到from+size条数据。当from=10000、size=10时,每个分片要返回10010条数据,若集群有3个分片,协调节点需处理3*10010=30030条数据,内存和CPU消耗呈指数级增长,甚至引发OOM(内存溢出)。
此外,Elasticsearch默认设置index.max_result_window=10000,当from+size超过该值时直接报错“Max size of has been exceeded”。根据鳄鱼java的调研数据,80%的Elasticsearch性能事故都与不恰当的深度分页方式有关,尤其是在大促期间的商品列表场景,用户翻到第100页后就无法继续查询,严重影响用户体验。
二、Scroll API:批量导出场景的“快照式”分页神器
Scroll API本质是生成一个查询结果的临时快照,通过scroll_id记录当前查询的位置,后续分页只需携带scroll_id即可获取下一批数据,无需重复计算from之前的所有结果,彻底规避了from+size的性能问题。
Scroll的核心执行步骤分为三步:1. 初始化滚动查询,设置scroll上下文保留时间;2. 携带scroll_id循环获取下一页数据;3. 及时清理scroll_id释放资源。DSL示例如下:
// 1. 初始化滚动查询,保留快照1分钟
POST /order_index/_search?scroll=1m
{
"size": 100,
"query": {"match_all": {}},
"sort": [{"order_time": "desc"}]
}
// 2. 后续分页,使用返回的scroll_id
POST /_search/scroll
{
"scroll": "1m",
"scroll_id": "DXF1ZXJ5QW5kRmV0Y2gBAAAAAAA..."
}
// 3. 清理scroll_id释放资源
DELETE /_search/scroll
{
"scroll_id": "DXF1ZXJ5QW5kRmV0Y2gBAAAAAAA..."
}
在SpringBoot项目中,可通过RestHighLevelClient实现Scroll查询,鳄鱼java的Elasticsearch实战专栏提供了完整的代码示例,包括批量导出20万条订单数据的实战教程。Scroll的优势是性能稳定,支持海量数据遍历,但缺点也很明显:生成的是快照,新写入的数据无法被查询到,不支持随机跳页,适合数据迁移、日志导出等非实时批量场景。
三、SearchAfter:实时前台分页的“游标式”解决方案
SearchAfter的核心原理是以上一页最后一条数据的排序值作为锚点,查询锚点之后的下一批数据,协调节点无需处理from之前的结果,性能几乎不受分页深度影响。同时,SearchAfter是实时查询,能获取最新写入的数据,完美适配电商商品列表、用户订单查询等前台实时分页场景。
使用SearchAfter必须满足两个条件:1. 必须指定排序规则,且其中包含一个全局唯一的字段(如_id或业务唯一ID),避免因排序值重复导致数据丢失;2. 每次查询需携带上一页最后一条数据的sort数组。DSL示例如下:
// 第一页查询
GET /product_index/_search
{
"size": 20,
"query": {"match": {"category": "电子产品"}},
"sort": [{"price": "desc"}, {"_id": "asc"}]
}
// 第二页查询,使用第一页最后一条数据的sort值
GET /product_index/_search
{
"size": 20,
"query": {"match": {"category": "电子产品"}},
"sort": [{"price": "desc"}, {"_id": "asc"}],
"search_after": [3999, "123456"]
}
SearchAfter的优势是实时性好、资源消耗低,但不支持随机跳页,只能逐页向后查询,这符合大多数前台用户的浏览习惯(很少跳至第100页,通常是逐页翻下一页)。鳄鱼java的性能测试数据显示,使用SearchAfter查询第1000页数据的响应时间仅为150ms,而from+size方式需要2.3s。
四、Elasticsearch 深度分页 Scroll 与 SearchAfter的选型对比
在实际生产中,选择Scroll还是SearchAfter,需根据业务场景的核心需求决定,以下是二者的关键维度对比:
1. 实时性:Scroll是快照式查询,新写入的数据不会被包含,适合非实时场景;SearchAfter是实时查询,能获取最新数据,适合前台实时分页。
2. 分页灵活性:Scroll不支持随机跳页,只能顺序遍历;SearchAfter同样不支持跳页,但支持逐页向后查询,更贴合用户行为。
3. 资源消耗:Scroll需保留快照上下文,长期未清理会占用大量内存;SearchAfter无快照,资源消耗低,可支持高并发场景。
4. 适用场景:Scroll适合批量数据导出、数据迁移、离线统计;SearchAfter适合电商商品列表、用户订单查询、后台管理系统的分页列表。
这里再次强调,Elasticsearch 深度分页 Scroll 与 SearchAfter并非替代关系,而是互补关系,企业可根据不同场景灵活搭配使用。
五、实战踩坑与优化技巧
在落地这两种方案时,容易遇到一些共性问题,鳄鱼java整理了以下踩坑与优化技巧:
1. Scroll API需及时清理scroll_id:若未及时调用DELETE接口清理scroll_id,快照会一直占用集群资源,严重时导致集群性能下降。建议在代码中使用try-finally块,确保无论是否异常都能清理scroll_id。
2. SearchAfter必须保证排序字段唯一:若排序字段存在重复值,会导致部分数据无法被查询到,建议在排序规则中加入_id字段,保证全局唯一。例如"sort": [{"price": "desc"}, {"_id": "asc"}]。
3. 限制Scroll的单次size值:虽然Scroll没有max_result_window的限制,但单次size过大仍会占用大量内存,建议单次size控制在1000-10000之间。
4. SearchAfter的分页状态维护:需在前端或后端存储上一页最后一条数据的sort值,避免用户刷新页面后丢失分页状态,可将sort值编码后存放在URL参数中。
六、生产级案例:某电商用SearchAfter优化商品列表分页
国内某生鲜电商之前使用from+size实现商品列表分页,当用户翻到第100页时,查询时间超过2s,且触发了max_result_window限制无法继续翻页,用户投诉量剧增。通过鳄鱼java的技术支持,该电商将商品列表分页替换为SearchAfter方案:
1. 修改排序规则,加入商品ID作为唯一排序字段:"sort": [{"sales": "desc"}, {"product_id": "asc"}];
2. 后端维护上一页最后一条商品的sort值,前端点击“下一页”时携带该值;
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。





