在 VLDB 2025 数据库国际会议上,OceanBase 与浙江大学、北京邮电大学、南洋理工大学等高校的联合研究成果有 4 篇论文入选。
这些研究不仅在数据库核心问题上提出了创新方法,也为应对未来技术挑战提供了新的思路和参考方向:
- 分布式可靠性:DBPecker 基于图模型与因果分析,实现对分布式数据库的复合异常诊断,加快故障定位,提升系统整体可靠性。
- 安全与隐私:Towards Practical Oblivious Map 提出高效的不经意存储方案,在保障数据隐私的同时显著降低通信和性能开销,为云数据库安全落地提供新的可行路径。
- 查询优化:RankPQO 引入学习排序方法,解决参数化查询优化中的稳定性难题,使数据库在复杂业务场景中保持稳健和高效的性能表现。
- 智能诊断:CoLA 将小模型与大语言模型结合,突破日志异常检测在准确性与效率上的瓶颈,为数据库运维提供更智能化的诊断工具。
Authors: Xinle Cao, Weiqi Feng, Jian Liu, Jinjin Zhou, Wenjing Fang, Lei Wang, Quanqing Xu, Chuanhui Yang, Kui Ren
本论文聚焦于云数据库安全中的一个核心挑战——如何高效实现键值(Key-Value, KV)存储系统的不经意性(Obliviousness),即确保攻击者无法通过观察查询过程中的访问模式推断用户敏感信息。
现有不经意 KV 数据库大多依赖不经意搜索树(Oblivious Search Tree, OST)来实现安全性,但这类方法在理论复杂度上存在明显瓶颈,尤其体现在用户与云端之间需要进行大量交互,导致通信开销和响应延迟较高,限制了其在实际场景中的应用。
为此,本文提出一种新颖的混合索引架构,将不经意搜索树(OST)与不经意哈希表(Oblivious Hash Table, OHT)结合,显著降低了系统的交互轮次与通信带宽。
此外,本文还对底层关键组件——不经意随机访问机(ORAM)进行了优化改进,进一步提升了系统在多种操作上的执行效率。实验结果表明,与现有的多个方案相比,本文方法在各种操作上均实现了显著性能提升。当数据规模达到千万级时,性能提升最高可达 70%,展现出更强的实用性与可扩展性。
论文地址:
https://dl.acm.org/doi/10.14778/3712221.3712235
Authors: Songsong Mo, Yue Zhao, Zhifeng Bao, Quanqing Xu, Chuanhui Yang, and Gao Cong.
随着参数化查询(Parameterized Query, PQ)在在线业务中广泛使用,参数化查询优化(PQO)显得尤为重要。然而,现有 PQO 技术在候选计划生成和最优计划选择上仍面临挑战:一方面,单纯依赖基数扰动生成候选计划往往效率不高;另一方面,基于绝对代价预测的计划选择在参数轻微变化时容易失准,从而引发计划不稳与性能波动。
为此,本文提出 RankPQO,一个面向参数化查询优化(PQO)的两阶段框架:在候选计划生成阶段,采用“混合式枚举”,一方面通过扰动谓词参数间接调节选择率/基数,另一方面按连接图采样多样化连接顺序,高效产出高质量候选;在最优计划选择阶段,引入基于学习排序(learning-to-rank)的 PRank 模型,不再回归绝对代价,而是直接比较任意两候选在给定参数向量下的相对优劣,从而提升在参数微变下的稳健性。
系统在 PostgreSQL 中以“离线生成 + 在线快速挑选”的工作流落地,并配套缓存少量代表性候选以降低在线开销。实验表明,RankPQO 相比 PostgreSQL 内置优化器最高提速 2.57×,相较当前最佳基线最高提速 1.36×,在多套真实数据集上同时提升了计划选择准确性与执行稳定性。
论文地址:
https://www.vldb.org/pvldb/vol18/p863-mo.pdf
3.CoLA: Model Collaboration for Log-based Anomaly Detection
Authors: Xuhang Zhu, Xiu Tang, Sai Wu, Jichen Li, Haobo Wang, Chang Yao, Quanqing Xu, Gang Chen
本文提出了一种名为 CoLA 的模型协同检测框架,在小型模型高效检测的基础上,结合大语言模型进行精准推理。实验结果表明,该方法在准确性和效率上均取得了显著提升。
论文地址:
https://dl.acm.org/doi/10.14778/3749646.3749668
4.DBPecker : A Graph-Based Compound Anomaly Diagnosis System for Distributed RDBMSs
Authors: Wu Qingliu, Qingfeng Xiang, Yingxia Shao, Qiyao Luo, Quanqing Xu
论文介绍了一款名为 DBPecker 的集成诊断平台,该平台专为分布式关系数据库系统而设计。DBPecker 利用一种基于图的异常建模方法来捕获节点间的依赖关系,并有效定位复合异常;同时,一个能感知因果关系的指标优先级排序模块会自动分离出关键的性能指标。
通过将异常检测与全面的根本原因分析流程相结合,该系统促进了在分布式数据库环境中的快速、精准诊断。在多节点的 OceanBase 集群上的评估结果表明,DBPecker 不仅加快了潜在异常的识别速度,还显著提高了系统的运维可靠性,为现实世界中的分布式数据库管理提供了切实可行的见解与建议。
论文地址:
https://www.vldb.org/pvldb/vol18/p5383-wu.pdf
通过这四篇联合研究论文,OceanBase 提出并验证了在安全性保障、参数化查询优化、日志异常检测及分布式系统诊断等关键方向上的创新方法,为数据库技术发展提供了新的思路,也为未来研究与系统设计提供了参考。
从海量交易处理到 AI 数据底座,数据库正处于技术革新的关键阶段。OceanBase 将持续把真实的工业场景挑战与前沿学术研究紧密结合,在稳定性、可扩展性、AI 驱动的数据系统、现代分布式数据库与分析系统融合等方向不断探索与创新,共同推动全球数据库领域在学术研究与产业实践中的前沿发展。
想了解更多资讯
扫码关注👇
了解更多考试相关
扫码添加上智启元官方客服微信👇