2021年6月26日,主题为“数据赋能产品创新”的第五届中国IT互联网产品创新大会在北京浦项中心召开,蚂蚁集团OceanBase的CTO杨传辉在现场发表了主题为《应用驱动自研数据库技术创新》的精彩演讲,讨论了分布式数据库经历的三代演变以及自主创新的价值。
应用是基础软件的第一推动力,好的应用只有真正应用到核心应用场景,才能发挥最大的价值。OceanBase分布式数据库在阿里巴巴、蚂蚁集团从零开始,通过应用驱动创新,再逐步应用到金融、公共事业等各个行业。如今已经在蚂蚁集团的所有核心业务应用,支撑起100%的业务流量,可以说在支付宝、淘宝上的每一步操作都是使用OceanBase自研数据库。
互联网时代数据库研发的价值
国家一直非常重视数据库芯片操作系统,但是一直无法做到理想状态,这是为什么?因为缺乏最核心的意义。杨传辉表示,在2、30年前的IT时代,许多技术软件研发公司往往走了一条模仿国外优秀产品的道路,而模仿导致了一个问题就是永远不可能比原厂做得更好,一个缺乏核心竞争力的企业没有办法将产品应用到最关键的业务场景,只能无限模仿形成死结,而解开死结的最好办法必定是有核心的应用。
在互联网时代,经常会提到分布式技术、云原生技术和AI技术,这些技术的出现使得数据库本身的技术架构有所突破,具有非常大的价值。第一个是解决了自主创新的问题,实现摆脱对国外专业软件的依赖。第二个是满足企业本身转型分布式架构的需求。第三个是性价比远高于经典的IOE架构,可以处理海量数据,甚至可能有数量级的提升。
给数据库按上分布式的翅膀
OceanBase打破世界纪录,性能分数首次突破亿级大关达到7.07亿tpmC,相比之前的成绩提升近11倍,荣获TPC-C数据库基准测试性能世界榜首。
杨传辉表示,为了让OceanBase资源数据库发展的更快,蚂蚁集团将OceanBase由一个部门变成了一家正式独立的商业公司,并在2021年再次取得了TPC-H世界第一的好成绩。OceanBase的技术理念第一个是完全自主研发,相较于基于开源做二次开发,它拥有对所有代码的完全掌控能力,以后发展的天花板会更高;第二个技术理念就是应用驱动创新,OceanBase在做数据库研发的时候,坚持产品化、抽象与标准化、坚持不为客户做定制。但是,数据库操作系统最难的问题是如何做生态。为此OceanBase选择选走开源开放的路线,并且在6月1日正式开源,和产业伙伴、用户、上下游各个链路的参与者来一起来共建资源数据库的生态。
站在经典数据库的肩膀上做创新
经典数据库包含存储、事务、SQL 这几个核心引擎,以及基于这些核心引擎之上的数据库功能和性能、成本、安全、可靠等企业级特性,OceanBase在此基础上经过了三次技术迭代,分别是第一代 NoSQL 系统,第二代可扩展的 SQL 处理,第三代代透明扩展的企业级数据库。仅在第一代的存储模型就使数据库的成本能够比经典的商业数据库降低到原来的1/3左右,成为整个新型数据库的标准。到了第二代,它能做到两地三中心、三地五中心、同城三机房等多种灵活的容灾部署,即使是服务器、机房、城市发生故障,业务也完全不受影响。第三代以OceanBase 为代表,分布式架构对业务透明,支持完备的兼容 MySQL 和 Oracle 的企业级功能,支持 HTAP 混合负载,采用 C 语言实现,单机性能很高,且系统架构的性能天花板很高,可以基于该架构追求极致性能。
“虽然分布式数据库在原生分布式架构上产生了很多创新技术,实现了高可用和可扩展但在数据库的功能、性能、精细化程度上还有一段很长的路要走。一个真正成熟的数据库产品,一定是面向全球的产品,希望有更多的一些用户、合作伙伴来跟我们一起成长,真正把中国的资源数据库给做好。”杨传辉说。