OceanBase 如何实现真正的 HTAP？

转自：DBA面试君

导语

OceanBase 专属面试

在高级 DBA 或架构师级别的面试中，基础的运维命令已经无法满足考官的胃口了。今天，我们模拟一个真实的高难度面试现场。

👉 【OceanBase 面试情景对话】

Interview scenario dialogue

👨‍💻 OceanBase 原厂资深技术专家 (考官)： “现在业界都在炒作 HTAP（混合事务和分析处理）的概念，很多说是HTAP，其实就是在底层挂了一个只读副本，做个逻辑同步，数据还是会有秒级的延迟。那么请问作为 DBA面试君，你认为 OceanBase从底层架构上，是如何做到真正意义上『一套数据，同时应对核心在线交易和海量分析』的实时 HTAP 的？”

😎 DBA面试君 (候选人)：“专家您好！OceanBase 实现真正的 HTAP 并不是靠简单的外挂组件，而是基于其原生的 LSM-Tree 底层架构、行列混存/纯列存技术、强悍的分布式计算引擎以及硬核的资源隔离机制共同构建的一套深度一体化体系。我们可以从以下四个核心层面来解构：”

💡 DBA面试君的深度拆解

1. 存储底层基石：基于 LSM-Tree 的“行列混合与列存引擎”

“解决『存放』矛盾：TP重行存，AP重列存”

LSM-Tree 原生优势： 传统的 B+ 树数据库更新时会产生大量随机 IO。而 OceanBase 基于 LSM-Tree 架构，最近的增量更新（主要是 TP事务）直接写入内存（MemTable），这部分数据是以行存格式保留的，能提供极高的并发 TPS（事务处理）。
SSTable 多种形态演进： 当内存数据刷盘并进行大合并（Major Compaction）生成基线数据 SSTable 时，OceanBase 开始施展魔法。在 OceanBase 4.3 版本中，它原生地引入了微块级别的列存（Column Store）引擎。
一份数据，两种表达： 数据在落盘时，可以保存为行列混合存储或者纯列存格式（不仅大幅提升了压缩比，甚至可达十倍压缩）。当分析型的大宽表查询（如 SUM、GROUP BY）到来时，系统直接拉取列存微块，利用向量化引擎，大幅度加速扫描。

2.计算层突围：原生分布式 SQL 与向量化引擎

“解决『算力』矛盾：单机 CPU 不够怎么办？”

全并行计算架构： 当一个报表型的超级大 SQL 发送给 OceanBase 时，优化器会将其拆解为多个并行执行的任务。OceanBase可以榨干所有节点（OBServer）的 CPU 核数，将任务分发到各个拥有数据碎片的节点进行分布式下推计算（聚合、过滤提前在本地做），最后在总控节点瞬间汇总。
向量化执行引擎（Vectorized Execution）： 原本的火山模型是一行一行处理数据，而 OceanBase 在拉取底层“列存微块”时，采用 CPU级别的向量化指令（SIMD），一次性处理一批（Batch）几十上百行的数据，大幅降低 CPU 开销。

3.智能大脑：基于代价的优化器（CBO）的“智能路由”

“识别『长短』请求，不走冤枉路”

TP / AP 智能分流： 在同一个节点内，优化器根据代价评估能够自动判断这是一个点查（走主键索引、回表拉取行存）还是一个全表扫描的 AP查询（直接引导读取列存微块，进行批量分析）。
读写请求物理路由： 如果架构规划上为了极致的稳定性，还可以通过配置部署，要求“只读列存副本（F 副本或者 R 副本）”专门利用 CPU去接手海量的历史数据分析，做到主副本全力负责 TP 写，而 AP 读请求毫秒级自动路由至对应副本。

4. 业务生命线：严苛的租户与系统级资源隔离

“解决『吵闹的邻居』：跑一个报表把核心交易整挂了？”

租户级别的隔离： 上一题我们讲了 Resource Pool，内存和 CPU 是严格按租户隔离的。
大查询与小查询的精细控制（Resource Manager）： OceanBase 甚至可以实现在**同一个租户内**的资源控制！通过绑定不同的数据库账号，或者打上Hint，将交易 SQL 和分析大 SQL 分配到不同的资源组（Cgroups技术）。比如限制那个跑报表的账号最多只能用 20% 的 CPU 核数。无论分析型大 SQL怎么折腾，绝对不会影响占有核心 CPU 的在线交易订单（TP业务）的极速写入！

📝 面试汇报总结：OceanBase HTAP 全景图

技术专家点评

“回答得非常出色！能把 LSM-Tree 的高频 TP 内存写入和底层落盘时 4.3版本的列存微块技术结合起来讲，说明你是真正懂内核而不是只看营销软文的。最让我满意的是你强调了『资源组隔离能力对于核心系统的保障作用』，这正是我们在真实金融级场景中落地HTAP 时最看重的安全防线。这轮架构面，过了！”

想了解更多干货，可通过下方扫码关注