近日,软件工程学院(滴水湖国际软件学院)2022级本科生武泽恺作为第一作者的论文《FGIM: A Fast Graph-based Indexes Merging Framework For Approximate Nearest Neighbor Search》被数据库领域国际顶级会议ACM SIGMOD 2026(International Conference on Management of Data)接收。这是学院首篇以本科生为第一作者被该顶级会议录用的研究论文。
该论文其他合作者包括程鹏(同济大学研究员,原学院青年研究员)、金加宝(学院2021级研究生,蚂蚁集团高级算法工程师)、钟萧遥(学院2022级研究生,蚂蚁集团高级算法工程师)、陈雷(香港科技大学教授)等。

论文第一作者武泽恺
随着向量数据库、推荐系统与大模型等应用的迅速发展,高维向量的近似近邻搜索(ANNS)已成为众多AI系统的关键基础能力。然而,在真实的工业级场景中,数据规模持续增长、在线请求吞吐不断提升以及系统对高可用性的要求,使得向量索引难以在内存受限的设备上高效、稳定地构建和维护。为兼顾实时写入能力与存储容量,业界大规模向量库通常采用混合图索引架构,内存索引用于承载实时增量写入,当其规模达到阈值后被卸载为磁盘索引,而磁盘索引又需周期性重建以维持搜索质量。由此,系统中不可避免地累积多份图结构向量索引,使得高效合并成为一个长期存在且尚未被有效解决的关键工程难题。传统方法往往依赖从头重建或受限于特定算法的增量构建,不仅代价高昂,还难以兼容多种主流索引结构,因而在大规模、高维数据场景下无法满足构建效率与查询性能的双重要求。

FGIM框架与流程图
武泽恺等人提出了FGIM框架,首次将图索引合并问题系统地建模为图结构融合任务,并通过统一的图结构转换、图结构迭代优化与可导航性优化机制,实现对多种主流图索引合并问题的高质量、高效率整合。FGIM能够在保留原有关键邻域关系的基础上,自动构建结构优良、适用于近邻搜索的新索引图,从而同时保证高效的搜索性能与合并效率。大规模实验证明,FGIM适配性广,能够整合多种主流图索引方法,相较现有增量构建方案实现最高3.5×的构建速度加速,对无原生增量构建能力的图结构索引合并可带来7.9×的平均加速,并长期保持与重构原生索引接近甚至更优的检索效果,显著提升了现代向量检索系统在动态环境下的工程可用性与实际价值。
关于SIGMOD会议
SIGMOD是数据库与数据管理领域最具影响力的顶级国际学术会议,由ACM(美国计算机协会)主办,以其严谨的审稿流程、前沿的研究成果和卓越的学术影响力著称,被CCF(中国计算机学会)推荐为A类国际顶级会议。大会长期以来在数据库系统、数据管理、查询优化与执行等方向引领全球研究趋势,是该领域最具权威性的顶级会议。本次SIGMOD 2026的Research Track继续采用严格的双盲同行评审机制,论文录用竞争激烈,具有极高的学术含金量。