OceanBase 六篇论文成功入选 SIGMOD 2025!17认证网

正规官方授权
更专业・更权威

OceanBase 六篇论文成功入选 SIGMOD 2025!

近日,数据库领域国际顶级学术会议 ACM SIGMOD 2025 在德国柏林顺利召开,OceanBase 团队共有 6 篇高质量论文被大会接收,再创 OceanBase 在该顶会中被收录论文数量新高。

ACM SIGMOD (ACM Special Interest Group on Management of Data) 是数据库领域历史悠久、最具权威性的国际顶级学术会议之一,代表着全球数据库研究的最高水平。本次收录不仅是 OceanBase 在数据库技术研究领域持续深耕的体现,更标志着 OceanBase 在分布式数据库核心技术和前沿方向上的创新成果再次获得了国际学术界的广泛认可。

本次入选的 6 篇论文,涵盖了研究论文 (Research Paper)、工业论文 (Industry Paper)、教程 (Tutorial)、演示论文 (Demo Paper) 等多种类型,研究主题聚焦大规模事务处理、现代存储架构、差分隐私、查询性能提升等数据库系统的核心挑战与前沿方向。其中 2 篇为 OceanBase 独立发表,展现了 OceanBase 团队前沿研究能力。

一、MaLT: A Framework for Managing Large Transactions in OceanBase(OceanBase 独立发表)

Authors: Chenguang Fang, Chen Qian, Qi Yang, Zeyu Wang, Zhenkun Yang, Fanyu Kong, Quanqing Xu, Hui Cao, Fusheng Han, and Chuanhui Yang.

本论文聚焦现代关系型数据库系统中大规模事务处理(OLTP)的实现,介绍了 MaLT,一个旨在高效管理 OceanBase 系统内大规模事务的框架。此框架引入事务上下文表(TCT)和事务数据表(TDT)来管理事务状态,并进一步设计了一种高效的恢复机制,以在系统故障后提供数据库的高可用性。与现有的大部分关系型数据库管理系统不同,MaLT 直接将事务在 LSM-Tree 中实现,将事务的回填和撤销操作无缝集成到 LSM-Tree 的合并阶段。这使得提交和回滚更高效,同时避免了从大型未提交事务中恢复系统的瞬间延迟。此外,MaLT 还将事务信息直接嵌入 LSM-Tree 中,并通过各种优化手段提升读写性能。最后,研究团队通过各种测试证明了该框架在 OceanBase 中落地的有效性和可扩展性。

论文地址:

https://dl.acm.org/doi/10.1145/3722212.3724442

二、OLTP Engines on Modern Storage Architectures(OceanBase 独立发表)

Authors: Daokun Hu, Quanqing Xu, and Chuanhui Yang.

随着互联网数据的快速增长,现代 OLTP 引擎在承载大数据量时遇到更高的挑战。近年来,存储架构不断演进(例如持久内存、 NVMe SSDs、CXL 等),通过缩小 DRAM 与传统块存储设备之间的性能差距或高效扩展内存池,缓解了内存及 I/O 压力。这些技术被用于增强和加速 OLTP 引擎,同时各种新兴的存储硬件和协议也提供了更好的可扩展性和远程访问能力。本次教程介绍了利用前沿存储解决方案的现代 OLTP 引擎,以及存储层次结构、协议和编程模型,同时,探讨了新兴存储架构对 OLTP 引擎带来的挑战和机遇。

论文地址:

https://dl.acm.org/doi/10.1145/3722212.3725633

三、RM^2: Answer Counting Queries Efficiently under Shuffle Differential Privacy

Authors: Qiyao Luo, Jianzhe Yu, Wei Dong, Quanqing Xu, Chuanhui Yang, and Ke Yi.

本论文聚焦于差分隐私的混洗模型(shuffle model ),通过让用户先将消息发送给可信的混洗器(shuffler),再匿名传送给不可信的分析器,从而在隐私与效用间达成平衡。本文致力于在混洗模型的差分隐私(shuffle-DP)框架下高效实现矩阵机制,论文提出一种基线 shuffle-DP 机制,实现对矩阵机制的原生适配;以及一种改进机制,在保持与中心化差分隐私(central-DP)相当的误差水平的同时,降低了消息复杂度,并通过实验结果证实了这种方法在常见查询工作负载中的通用性,并在消息效率上取得了显著提升。

论文地址:

https://dl.acm.org/doi/10.1145/3725415

四、Efficient and Accurate Differentially Private Cardinality Continual Releases

Authors: Dongdong Xie, Pinghui Wang, Quanqing Xu, Chuanhui Yang, and Rundong Li.

本论文聚焦准确实时估算数据流中出现的唯一元素数量(基数估算)问题。传统的基于概要的算法提供了节省内存的解决方案,但在数据流元素涉及隐私且需要差分隐私的场景中表现不足。本文提出了一种名为 FC 的新型基数估算框架,在持续发布的情况下确保差分隐私,且实现了低内存占用、高精度和高效计算。该方法创新性地利用一种高效基数估算器和隐私保护机制,克服了现有方法的局限。实验表明,与此前最佳方法相比,该方法实现内存占用降低达 504 倍,同时几乎保持相同精度。此外,在相同内存限制下,该方法将估算精度提升了多个数量级。

论文地址:

https://dl.acm.org/doi/10.1145/3725288

五、Mitigating the Impedance Mismatch between Prediction Query Execution and Database Engine

Authors: Chenyang Zhang, Junxiong Peng, Chen Xu, Quanqing Xu, and Chuanhui Yang.

随着将机器学习(ML)模型应用于数据库中存储的数据以执行分析的预测查询日益普遍,当前数据库系统引入了 Python UDFs 并调用 ML 框架进行推理。然而,数据库引擎与预测查询执行之间的不匹配对查询性能提出了挑战。为应对该挑战,本论文提出在数据库引擎中采用一种预测感知算子(prediction-aware operator),利用推理上下文重用缓存实现自动一次性推理上下文设置,并通过批量感知函数确保理想的批量化推理。研究团队基于 OceanBase 实现了名为 IMBridge 的原型系统。实验表明,IMBridge 在预测查询执行方面实现平均 71.4 倍效率提升,且显著优于其他解决方案。

论文地址:

https://dl.acm.org/doi/10.1145/3725326

六、A Query-Aware Enormous Database Generator For System Performance Evaluation

Authors: Xuhua Huang, Zirui Hu, Siyang Weng, Rong Zhang, Chengcheng Yang, Xuan Zhou, Weining Qian, Chuanhui Yang, Quanqing Xu.

在生产环境中,对数据库基准测试或性能调试而言,模拟真实应用而不泄露隐私数据至关重要。为此,研究者提出了大量查询感知型数据库生成器(QAG)。由于查询背后隐藏着复杂的数据依赖关系,以往系统在支持复杂操作符且保证高仿真精度方面存在不足。该论文提出数据生成器 Mirage,即使涉及复杂操作符,也能基于查询重现应用,且理论误差为零。实验结果表明,相较于同类生成器,Mirage 支持的操作符最广泛,其仿真保真度也最高。

论文地址:

https://dl.acm.org/doi/10.1145/3722212.3725076

OceanBase 在 SIGMOD 2025 现场

持续在国际顶级学术会议上取得突破性成果,彰显了 OceanBase 在数据库基础研究与核心技术攻关上的深厚积累和前瞻视野。根植于深厚的自研土壤,OceanBase 的研究团队始终致力于攻克数据库领域的核心难题,不断推动技术与工业的创新与实践,将每一项技术突破转化为产品力量,服务于全球用户对高性能、高可靠、高安全的原生分布式数据库的更高追求。

未来,OceanBase 将持续投入数据库核心研究,深耕基础技术,携手全球学术界与产业界伙伴,共同推动数据库技术的创新与发展。

想了解更多资讯

扫码关注👇

了解更多考试相关

扫码添加上智启元官方客服微信👇

未经允许不得转载:17认证网 » OceanBase 六篇论文成功入选 SIGMOD 2025!
分享到:0

评论已关闭。

400-663-6632
咨询老师
咨询老师
咨询老师