日前,OceanBase 携手中国太平洋保险集团率先完成全国首个全险种、全核心系统国产升级案例登上央视网!
央视网报道 OceanBase 加速金融行业数智化转型
面对中国太保数据量庞大、业务极其复杂的核心系统,OceanBase 数据库交出了分析型数据加工处理能力提升 10 倍、双降本超亿元的硬核成绩单,完全达到甚至部分超越原有性能指标!
稿件指出,该案例打造了可复制、可推广的国产升级路径,为金融行业核心系统升级树立了全新标杆。
OceanBase CEO 杨冰接受央视网采访时表示,未来,OceanBase 会携手更多合作伙伴,共同推进国产数据库迈向新高度,为中国的数字化建设贡献力量。
OceanBase 如何携手中国太平洋保险集团率先完成全国首个全险种、全核心系统国产升级,实现国产数据库从“可用”到“好用”的关键跨越?
下文为中国太保产险集中收付核心系统基于 OceanBase 的创新实践,相信会带来答案。
作者 | 中国太保集团数智研究院首席数据库专家林春
中国太保产险集中收付系统是中国太保产险的核心财务中枢,承担着产险全公司收款、付款、车船税申报、开票管理、进项税处理及总账核算等关键职能。
系统需同时应对海量批量结算(如保费收缴、赔款支付)与高频日常财务作业的双重压力,对海量数据的计算能力、毫厘不差的数据一致性以及高并发事务处理有着极致要求。其稳定性和性能直接关系到公司运营命脉。
作为提供 7×24 小时不间断服务的基础财务平台,系统全年可用性必须高于 99.9%,停机窗口管控极其严苛,是太保运维保障等级最高的核心系统之一。
该核心系统上线采用原生分布式数据库 OceanBase 作为数据库基座,上线后系统稳定运行,奠定了金融行业数据库升级新标杆。
产险集中收付系统升级改造复杂,是中国太保覆盖产险、寿险、资管、健康险等的全险种、全场景应用转型的收官战役,此次系统迁移与技术升级挑战集中体现在四大难点:
1.规模瓶颈与架构创新: 系统数据体量庞大,超过 60 TB,存在海量并发查询、海量加工场景,CPU 计算资源需求极高,传统单节点架构已无法满足高可用切换要求。
2.深度技术栈依赖: 系统中海量存储过程超过百万行。深度使用 Oracle 特性,技术栈与 Oracle 特性深度绑定,繁多的定时任务和批处理程序高度依赖 Oracle 特有的调度机制与高级功能,迁移改造难度陡增。
3.峰值性能的极限考验: “双 11 ”“双 12 ”“开门红”、年度结算等重大业务高峰,QPS 峰值超过 10 万,对系统数据处理能力构成极端压力,要求系统在峰值期间依然保持超高的吞吐量和极低的处理延迟。
4.高可用服务与高并发压力: 作为 7×24 小时服务平台,且与众多上下游系统紧密集成,要求底层数据库具备顶尖的高并发处理能力和无懈可击的高可用/容灾特性,任何闪失都可能引发连锁反应。
集中收付系统作为核心业务支撑平台,历经多年迭代升级,伴随数十次版本更替,系统底层数据库积累了海量历史数据,数据存储压力日益凸显。其中,规模最大的一张业务单表连同关联索引,存储容量已高达 20 TB,不仅占用大量服务器存储资源,更严重影响 SQL 查询效率。同时,数据迁移存在效率低数据比对困难等问题。
为彻底解决这一问题,中国太保产险使用应用改造预评估工具对数据库进行瘦身,对数据库内所有大表进行排查与深度分析,结合业务数据生命周期管理规范,设计多套差异化数据瘦身方案。对于数据更新频率低、以查询为主的静态表,以及长期无新增、修改、删除操作的历史数据表,采用 “冷数据归档” 策略,将 3 年以上的历史数据迁移至低成本的离线存储集群,既保留数据可追溯性,又释放核心数据库存储空间;对于仍有低频更新的业务表,则实施 “分区表改造 + 增量归档” 方案,按时间维度拆分数据表,仅保留近 1 年热数据在核心存储,历史分区数据定期归档。
此外,一般系统 DML 语句的比例通常不超过 10%,而集中收付系统业务类型较为特殊,DML 比例超过 20%,尤其是更新语句占比超过 15%,高频 DML 语句需要关注相关表上冗余索引的清理,以提升性能和减少 CPU、内存资源的开销。中国太保产险通过应用改造预评估工具,识别高频 DML 语句相关表,分析数据访问模式与索引设计需求。
结合业务查询场景,评估现有索引架构的合理性,识别并清理冗余索引、重复索引及长期未使用的无效索引,减少索引维护开销与内存资源使用压力。通过系列优化措施,显著提升了集中收付系统的运行稳定性与业务处理效率。
在性能压测过程中,发现数据库服务器存在 CPU 负载尖刺,平时 CPU 使用率平均在 20%左右,CPU 负载尖刺发生时会上升到 80%,持续 20 秒左右,经排查,定位导致 CPU 负载尖刺的高频查询问题 SQL。
抓取问题 SQL 语句脚本如下:
select sql_id,
RET CODE,
count(*),
round(avg(elapsed time/1000),0)as 平均消耗时间_亳秒,
round(sum(elapsed time/1000),0)as 总消耗时间_亳秒
from gv$sql_audit>where tenant_name='tenant_test'
and usec_to_time(request_time) >= '2025-03-25 15:06:40'and usec_to_time(request_time)<'2025-03-25 15:07:00'
group by sql_id
order by sum(elapsed_time)desc limit 50;
定位该问题 SQL 语句如下:
SELECT POLICYNO,ENDORSENO,CLAIMNO,APPLYNO,SUBCOMPANY, CURRENCYCODE, AMOUNT,OPDATE ,OPCODE, CLASSESCODE,
DEPARTMENTCODE, CUSTOMERNAME, TYPE, BUSINESSONE,BUSINESSTWO,SEQREPORTNO ,ACCOUNTNO
FROM MM_UNICHARGEDEAL_TD_BAK T WHERE T.POLICYNO='AXIA160E2125B000209A'
AND T.SUBCOMPANY='7010100' AND BUSINESSONE IN ('A01','A02') AND BUSINESSTWO IN ('001','002') AND CURRENCYCODE='01';
经分析发现,上述问题 SQL 语句虽然执行计划也用到了包含 POLICYNO 字段的本地单列索引,并且该索引区分度较高,单条语句平均执行时长为 40 毫秒,但是在较短时间区间,该语句高频执行了数十万次,导致 CPU 短暂冲高到 70%-80%。通过子公司号+策略号+币种+业务编码字段上创建复合索引,精准匹配,可以大幅降低执行时间,降低 CPU 开销。
创建复合索引语句如下:
create index test_ind on
MM_UNICHARGEDEAL_TD_BAK(subcompany,POLICYNO,CURRENCYCODE,BUSINESSONE) local;
使用复合索引后,执行计划成本从 1016 降为 100,平均 SQL 执行时间苍 45.6 毫秒降低为 0.78 毫秒,提升 58.46 倍,最慢执行时长从 3.15 秒降低至 0.33 秒,提升 9.55 倍。通过复合索引精准设计,从而解决了高频查询语句CPU瓶颈问题,取得了良好的效果。
为提供开发测试效率,并提升生产安全性,集中收付平台在性能压测阶段就接入了太保风险 SQL 治理平台。
平台通过系统整合中国太保 300 多个应用系统的历史运行数据,构建了覆盖全业务场景的风险 SQL 识别知识库。通过专家经验与机器学习相结合,提炼出 5大类 25 子类的风险识别规则体系,具体规则超 200 项。
规则不仅包含 SQL 文本层面的特征识别(如全表扫描、隐式类型转换、超长事务等),还创新性地纳入了执行计划特征分析、系统资源消耗模式等多维度指标,形成了完整的风险 SQL 识别方法论。
平台基于 OceanBase 本身丰富的监控视图,突破主流监控技术仅关注 SQL 执行时长的局限,建立了多维度 SQL 语句性能影响量化模型,首创 CPU 资源性能影响量化模型,通过”单次执行时长×执行频次”计算 SQL 总开销,精准定位高频低耗类风险 SQL。
平台还首创执行计划劣变识别方案,通过 SQL 性能下降 10 倍以上、劣变计划平均耗时>10 秒等规则,实现 SQL 执行计划劣变主动识别,避免了由于 SQL 执行计划劣变导致的系统性能及稳定性大幅下降的风险。
同时建立差异化风险识别标准,覆盖数据源、链路、环境等 6 大维度,实现开发-测试-生产全生命周期监控。将风险识别前置到测试阶段,减少了生产环境系统风险。通过接入风险 SQL 平台,将 70% 风险化解在上线前,极大地降低了集中收付系统上线风险。
成果
集中收付系统上线后,结合应用优化结合 OceanBase 良好产品特性,性能大幅提升。交易平均响应时间持续控制在 1 秒以内,为用户带来流畅的操作体验,为太保产险财务的稳健高效运营奠定了坚实的技术底座。
1. 压缩存储资源,突破规模瓶颈:借助 OceanBase 的压缩特性与数据库瘦身技术,成功将原本 60T 的存储需求压缩至原来的 20%,即仅需 12T 存储空间,大幅减少硬件投入与运维成本,有效突破存储规模瓶颈,为系统后续扩容奠定基础。
2. 智能数据生命周期管理机制:创新打造全自动化的数据归档与智能回迁体系,实现对海量历史数据的精准周期归档处理。系统可在业务关键时毫秒级响应,支持数据安全无缝回迁,全面保障企业数据的完整性、高可用,赋能业务敏捷迭代。
3. 业务导向型多线程并行处理引擎:面向高计算复杂度业务场景,推出以业务维度(如分公司、业务线)为核心的智能分组并行处理方案。通过多线程协同与资源优化分配,大幅提升任务执行效率与资源利用率,助力企业应对大规模数据处理挑战,实现极致性能体验。
4. 高度兼容Oracle带来的平滑迁移: 产用联合攻坚克难,依托OceanBase对 Oracle 的高度兼容性,结合太保多年迁移经验,实现集中收付系统平滑迁移。
5. 峰值性能的极限考验:集中收付系统作为核心交易系统,日常 QPS 峰值到达 4 万,“双 11 ”“双 12 ”“开门红”等重大业务高峰期,QPS 上升 30%,迁移后系统在极限峰值压力下依旧稳定高效运行,无卡顿、延迟问题,保障业务高峰交易顺畅。
6. 高可用服务:基于 OceanBase 的可靠的高可用能力,系统实现 RPO(恢复点目标)=0,确保数据零丢失;同时 RTO(恢复时间目标)小于 8 秒,即便遭遇突发故障,也能快速恢复服务,为集中收付业务提供坚实的连续性保障。
从“可用”到“好用”,这是 OceanBase 的进阶之路,更是过去 15 年坚守“根自研”初心交上的最好答卷。
自 2010 年初创,敲下第一行代码以来,OceanBase 凭借对技术的极致追求,不断突破技术难关,从金融行业走向国计民生、走向海外。如今,已广泛应用于金融、运营商、零售、互联网及公共服务等行业,助力 2000+ 客户实现关键业务系统升级。IDC 最新报告显示,OceanBase 已占据中国分布式事务数据库本地部署市场份额第一。
未来,OceanBase 将继续以“根自研”驱动行业智能化升级,以高可用、高性能保障数据安全稳定,应对海量数据处理需求,并积极推进“Data × AI”战略,打造一体化数据底座,在助力行业数字化转型的同时,扬帆出海,不断走向全球化,让中国数据库登上世界舞台。
想了解更多资讯
扫码关注👇
了解更多考试相关
扫码添加上智启元官方客服微信👇