Academics | The Hong Kong University of Science and Technology

向量检索及GPU加速
司永浩
司永浩
G PU加速向量检索项目旨在探讨在医疗病理学等大规模数据应用中,如何实现高效、实时的高维向量相似性搜索。该研究旨在解决一个核心挑战:当数字病理切片与诊断报告等非结构化数据被编码为千万乃至亿级的海量向量时,传统搜索方法因耗时过长而无法满足临床实时性需求。项目系统地剖析了近似最近邻搜索(ANNS)的关键技术,涵盖了从IVFPQ等基于量化的方法到HNSW等基于图的先进索引策略。最终,该项目重点阐明了GPU并行计算在重构检索流水线中的革命性作用,并以SONG、CAGRA等前沿算法为例,展示了如何通过硬件加速实现对海量数据的瞬时响应,为精准诊断与科研探索提供强大的技术支持。

相关论文