老鱼笔记 | 万里数据库是一家怎样的公司?
2021.01.19本文字数:3958字 阅读时间:13分钟 去年的一鸣惊人,让万里数据库开始进入大众视野。 2020年7月15日,中移动信息技术有限公司自主可控OLTP数据库联合创新项目公示中标候选人,其中主备式数据库标包:南大通用、人大金仓、阿里云计算中标份额分别为50%、30%、20%;分布式标包:万里开源、中兴通讯中标份额分别为60%、40%。 公示链接: https://b2b.10086.cn/b2b/main/viewNoticeContent.html?noticeBean.id=673931 相比其它4家在数据库领域耳熟能详的公司,万里数据库公司就显得有些陌生,但其在分布式标包中标份额高达60%,却大大超出市场预期。因此,安信证券研报称万里数据库是国产数据库最大黑马。 2020年9月21日,万里数据库中标中国光大银行“开源数据库软件现场服务选型入围项目”。 2020年12月,万里数据库中标2020-2021年联通沃音乐大数据服务项目。 2020年12月,万里数据库又入围国网信息通信产业集团有限公司2021年度的框架采购项目。 …… 连续中标竞争激烈的知名大型企业,出现在一家名不见经传的公司身上,让人不禁好奇,万里数据库到底是家怎样的公司?一鸣惊人的背后又有着怎样不为人知的故事? 12月,万里开源进行品牌升级,正式启用“万里数据库”新品牌,英文名称为“GreatDB”,借此机会,老鱼专访了万里数据库联合创始人林韶宾。 虽然早就对林韶宾有所耳闻,但第一次真正见面还是在去年的12月。 12月18日的北京,寒潮来袭,已经极为寒冷,但在建外SOHO东区B座32层的万里数据库多功能会议室内却温暖如春,略微有些凌乱的发型、运动鞋,语速不快,真诚坦率,是老鱼对林韶宾的第一印象。 林韶宾,国内最早的分布式事务库开发者及商业化实践者之一,有着10年数据库开发经验和5年销售经验。2006年-2009年,一直从事MySQL Dev & Support工作,2010年-2013年,主导研发了万里数据库第一代Share Nothing 架构分布式数据库。2013年,成为公司合伙人,后负责市场及销售,开拓了通信、金融、电力等行业客户。2018年,回归技术,带队负责新版本云原生分布式数据库开发。 “我是研发中最懂销售的,销售中最懂研发的。”林韶宾笑着说,也正因为如此,被同事亲切的称之为研发销售的知心大哥。 GreatDB 前世今生 万里数据库并不是一家新兴企业,而是有20余年积淀,专注于自主可控数据库和操作系统研发和服务的老牌企业。 或许是因为技术基因过重,公司更专注于产品研发,万里数据库的品牌知名度甚至还不如其控股的全资子公司拓林思(Turbolinux ,国内最早从事Linux产品化的公司)。 很多人或许并不知道,万里数据库是国内最早从事国际主流数据库核心研发的本地团队,其数据库技术底蕴主要来自于从2006年开始与MySQL AB合作成立的MySQL中国研发中心。 2008年,MySQL被Sun收购,万里数据库继续与Sun开展数据库研发合作。在此期间,万里数据库技术团队负责当时MySQL的Replication新功能开发、NDB Cluster新功能开发、大量BUG修复以及中文手册的编译等工作。 2009年,Sun被Oracle收购,万里数据库继续与Oracle合作研发一段时间后终止合作,并于2010年开始独立自研分布式事务型数据库(GreatDB)。这在当时是具有前瞻性的,因为国内还没有一款分布式数据库,还是一片蓝海市场。 林韶宾说,坚定的选择分布式数据库方向,主要基于业务和技术两方面的考虑,技术上,主要是受到云计算的启发,团队认为弹性化、分布式是数据库发展大势。而当时MySQL的NDB Cluster数据库是内存型数据库,购自爱立信,是根据瑞典的人口基数设计的,因此,架构上决定了并发和数据量上限等不能满足中国用户的需要。 从业务角度看,Oracle等传统数据库厂商已牢牢占据集中式数据库市场,只有另辟蹊径才有新出路。 GreatDB 第一个客户 做基础软件,是个苦活累活。相比于应用软件,基础软件的技术含量高得多,熬得年头也长,累得死去活来,实际收益却很低。 从2010年开始研发到2013年上半年,是一段艰难的日子,万里数据库主要是依靠气象局、UT斯达康等客户的MySQL定制化开发和服务支持来支撑GreatDB的研发。 好在2013年下半年, GreatDB终于迎来了第一个客户——河南移动。在河南移动流量经营分析系统中,原始数据库非常庞大,初步统计完的数据需要存储到数据集市层,这样的数据量级,单机数据库解决不了。因此,当时决定使用万里数据库GreatDB。 林韶宾说,当时应用厂商希望把这个项目作为标杆项目,向全国省移动去推广。压力挺大,因为当时的GreatDB并非现在,还并不成熟,很多功能都是现开发、现改BUG。那段时间,团队几乎与应用开发商天天吃住都在一起,每天只睡三四个小时,连续三个月。最终,产品满足客户需求,系统运行极其稳定。 市场一旦打开缺口,接下来就是水到渠成。继河南移动之后,GreatDB在北京移动、四川移动、广东电信、山东移动等客户上相继应用。 基础软件需要时间积累,更需要不同场景的应用打磨。林韶宾说,GreatDB在多个客户测试中性能领先,例如:在中移动OLTP数据库联合创新项目中,我们的分布式数据库性能指标位居第一。 “如果没有之前在数据库方面长时间的技术积累,短时间内是不可能做好的,因为性能不是一下子就能优化上去的。”林韶宾说。最终,GreatDB在性能测试方面排名第一,满足了中国移动提出的所有指标。这从侧面也证明了万里数据库的产品技术能力过硬。 GreatDB 混沌测试工具 河南移动流量经营分析系统能稳定运行多年,在林韶宾看来,产品稳定是来源于充分的测试。 对于林韶宾这样的数据库开发老炮,研发过程中最大的痛点不是解决问题,而是发现并重现问题,如何保障产品的稳定性?涉及分布式产品测试,与以往单机不同,分布式架构有许多故障组合,尤其是机器多了以后,计算、存储节点,包含对上下游工具的兼容等,都会导致一系列行为的不同。 GreatDB追求的目标是极致易用、极致稳定、极致性能。易用能提升客户体验感,稳定是数据库的刚需,高效是对性能的极致追求。林韶宾说。 因此,GreatDB追求与单机数据库相同的用户体验,但分布式架构会导致故障复杂度呈指数级变化。最初,团队选择一些测例去跑,但这并不能反映实际业务场景,因此,林韶宾觉得需要一种全新思路去做测试。 其次,效率是个大问题,因为,人工测试做起来效率太低,故障组合根本测不完。 为此,林韶宾带着团队研发攻关了很久,最终倒腾出了一个牛逼的东西“混沌测试工具DBomb”,通俗的说是一个分布式测试框架,它解决了分布式数据库测试的大难题,能随机模拟各种故障,不仅包含了各种故障测例,更包含了用户提出的各种奇葩测试,通过开发接口,能让产品测试自动化,非常灵活。林韶宾说。 万里数据库的理念是“数据丢失0容忍、业务波动0容忍”,通过这些年在众多企业级客户的POC和应用部署,万里数据库积累了大量的应用场景和实践经验,团队都会将行业标准POC和用户测试用例整合到DBomb中。 每一次产品的迭代更新,都会使用DBomb模拟不同的场景和故障,历经非常多的测试,为GreatDB产品在稳定性上提供了极大的保障。 GreatDB 的进化 GreatDB现在是原生分布式数据库。 从国内分布式事务的实现角度,林韶宾认为是从开源数据库+中间件(1代)到原生分布式(2代)的演进。 1代中间件型,是GreatDB早期尝试过的一个形态,有长期适用的场景,有些场景下性能更有优势,灵活性更好;但是中间件型分布式对应用开发限制较大,比如SQL语法支持差、存储过程等数据库对象支持较差、数据需要强制分布等。其次,中间件型的分布式易用性也较差,运维复杂,对于事务支持不完整代价极大。 林韶宾说,GreatDB现在进化到了2代原生分布式,在SQL语法、数据库对象等更易实现。事务完整性得到更好解决,对应用开发几乎无限制。 GreatDB还针对中国企业级市场的需求,改进了事务模型,从吞吐和延时两个维度改进了性能。从用户角度出发,对2代原生分布式数据库进行了增强,林韶宾把它定义为新一代分布式数据库。 虽然GreatDB已经是原生分布式数据库。但林韶宾却并没有否定中间件型分布式的存在价值。 林韶宾说,“我们不能去否定中间件这种架构,因为它有生存空间。比如:对于某些业务查询比较简单,中间件在性能上可能会更好,因为对事务的损耗会小些。” 从长期来看,如果原生分布式数据库发展越来越好了,中间件形态的分布式迟早是要消亡的。但绝不是在两三年之内,林韶宾说。 GreatDB 机遇与挑战 进入到2018年,越来越多的巨头进入到数据库赛道,打破了万里数据库“小而美”的生存发展模式,这让林韶宾及其团队产生了极强的危机感,如果不能快速的做大做强,GreatDB必然会被淹没在竞争的洪流当中。 与此同时,林韶宾也看到信创的机会越来越明显。根据民生证券的研究报告,因为国产替换将带来十倍以上的数据库增长空间:假设至2024年完成替换,按100%替换计算,则合计市场增量为626亿;若按50%替换计算,则新增空间235亿。 从这两点看,引入资本就成为必然的选择。在综合考虑之后,万里数据库引入了创意信息作为股东。 创意信息是A股上市公司,不仅为万里数据库带来资本加持,同时作为大型的系统集成商,也给万里数据库带来了更大的市场和渠道,两者目标客户有重合,可以相互借力,这就是万里数据库引入创意信息的缘由。 有了好的产品,过硬的技术团队,又有上市公司资金加持,这让万里数据库具备了与巨头竞争的实力。 对于万里数据库的定位和市场机会,林韶宾有着清晰的认知,国内数据库市场未来会形成至少2个梯队。第1梯队是互联网巨头,万里数据库的目标是做第2梯队领头羊。 为什么互联网巨头之外,还能有第2梯队,林韶宾指出,客户去O是为了避免被外资大厂捆绑,同样也不愿意接下来被另外的巨头捆绑,这就给万里数据库这样的独立数据库厂商提供了市场空间。 当前,对于万里数据库而言,最重要的是做好产品与服务,满足客户需求,提升客户满意度。 截至目前,万里数据库已在中国移动智慧中台(西藏工程)项目、山东移动数据中台等项目完成上线。与光大银行、光大科技基于GreatDB源码联合研发了EverDB数据库,并在光大银行云缴费、统一支付等系统进行推广应用。与国网联合研发的自主可控数据库已经支撑国家电网众多业务系统建设,覆盖了集团总部、27家网省公司及节能服务公司、信产集团等直属单位,服务于国网营销、发展、人资、财务、信通等多个业务部门。 如今国内数据库市场格局,哪家能笑到最后,现在还无法妄断,但越到最后,势必竞争就会越激烈越残酷。 对于已经初露峥嵘的万里数据库,你们怎么看? - END - 万里数据库简介 万里数据库是北京万里开源软件有限公司自主研发的新一代分布式数据库,经过10余年的应用验证,在功能、性能、稳定性、易用性等方面均处于行业领先水平,历经500多个业务场景的锤炼,已广泛应用于金融、能源、通信、政府、交通等多个行业。 扫码二维码 关注公众号