以下内容是根据玖章算术CEO叶正盛在「3306π 数据库朋友圈」技术演讲整理。文末附完整的PPT下载链接!
MySQL与PostgreSQL都是非常优秀并且非常成功的数据库,PostgreSQL的功能比MySQL强大,但是依然没有MySQL流行,作者从产品功能、技术架构、生态、品牌商业几方面来分析原因。
根据搜索引擎指数统计,过去1年Google Trends(全球)显示MySQL关键字网页搜索是PostgreSQL的1.5倍,百度指数(中国)显示MySQL是PostgreSQL的4.2倍。
根据云厂商调研数据,全球MySQL用量大概是PostgreSQL的3倍,中国大概是15倍(备注,云厂商数据统计口径比较多,仅供参考)。
DB-Engines从2013年开始对全球数据库流行度做跟踪,每个月从搜索引擎(Google)、社区问答(Stack overflow,DBA Stack Exchange)、企业招聘岗位(Indeed,Simply hired)、个人资料(Linkedin)、社区话题(Twitter)等渠道采集数据并做加权计分,在行业里有很高权威性。从2023年9月份的数据看,MySQL以1111分排名第2,PostgreSQL以621分排名第4。
1、PostgreSQL没有MySQL流行的10个原因
综合来看,MySQL比PostgreSQL都具有更高的流行度,但是PostgreSQL在产品功能方面是公认的开源领域No.1。为什么功能强大的PostgreSQL没有MySQL流行,作者总结了以下10个原因。
从产品功能分析,虽然MySQL没有PostgreSQL功能强大,但是MySQL基于线程模型+读写分离方案,在早期互联网兴起时LAMP(Linux+Apache+MySQL+PHP)是非常流行的解决方案。早期(2000~2010)MySQL更多使用在新闻、论坛等互联网场景,随着InnoDB存储引擎的成熟,MySQL在事务处理方面也全面增强,开始在互联网交易领域全面开花,如阿里巴巴使用MySQL全面完成了去IOE,京东、携程也从Oracle/SQLServer转到了分布式MySQL架构。PostgreSQL因为是进程模型,与PHP这类没有内置连接池的语言较难配合,在高并发的互联网场景不如MySQL有扩展优势,并且大型互联网公司在分库分表后SQL语句普遍较简单,PostgreSQL不能体现出竞争力。
从公司和品牌观察,MySQL长期有主体公司(MySQL AB/SUN/Oracle)推动,并且基于GPL开源协议(GPL主旨是第三方如果修改源码再发布需要回馈到主干或者开源),可以更好聚合社区回馈形成品牌效应,PostgreSQL的没有绝对的主体商业公司驱动,加上宽松的类BSD/MIT协议,PostgreSQL有很多分支,功能并没有回馈到主干,导致社区品牌效应没有MySQL聚力。
MySQL的易用性非常好,出生就支持Windows/Linux,MySQL的小巧灵活,简单易用(limit分页、show语法等等),获得了很多开发者的喜爱,容易形成人才优势,人才技能会很大影响着软件架构选型。PostgreSQL早期只支持Linux,直到8.0才支持Windows,它在代码结构与数据库标准实现方面是典范,是学术领域的最爱,但是学术研究相比工业应用的人群少很多,实践成功案例不如MySQL丰富。
MySQL在中国流行度是全球最高,很大原因来自于新浪、网易、搜狐、百度、腾讯等公司早期使用PHP+MySQL的实践,再加上阿里巴巴成功通过Java+MySQL完成去IOE的标杆案例,让MySQL在中国全面压倒性超越PostgreSQL。题外话:MySQL在英文含义与发音方面相比PostgreSQL简洁,对于大众品牌心智来说有些许优势。
数据库是非常核心的基础软件,生产使用后替换的成本很高,即使现在看PostgreSQL在功能上更领先,但是在稳定性方面没有得到大规模的验证、人才储备不足的情况下,要替换现有系统是高风险的事情。Uber曾经就因为使用PostgreSQL遇到很多问题,然后全部迁移到MySQL。
2、数据库在主要业务场景的竞争力分析和展望
在互联网领域,MySQL有绝对的影响力,但是我们也看到PostgreSQL在GIS(地理信息系统)领域非常强大,PostGIS是PostgreSQL面向GIS领域的专业插件,几乎成为GIS领域的标准解决方案。
PostgreSQL已经错失了互联网机遇,不过它支持更复杂的SQL,HTAP能力也更加出色,适合应用于企业级软件领域(ERP、CRM、BOSS等等)。但随着中国的信创产业发展迅速,PostgreSQL宽松的BSD开源协议,很多厂商基于PostgreSQL发展出了新型国产数据库,提供更好的服务支持,信创涉及到大量系统替换,这可能会是PostgreSQL在中国迎来新的发展机会。另外PostgreSQL的pgVector插件可以支持基础的向量数据库功能,在赶上了今天ChatGPT引领的大模型AI时代风口。
产品与技术总是在不停的进步,MySQL与PostgreSQL的选型还会是持续争论的话题,MySQL依靠互联网有先发优势,并且人才丰富,当前在互联网领域还会是首选,但是由于MySQL对复杂SQL支持不足,在企业级软件领域PostgreSQL会更有后劲。虽然国内Oracle、DB2这些企业级数据库都将远去,但是我们看见达梦、OceanBase等自研数据库在飞速发展,PostgreSQL还会面临新一轮的竞争。
本文更多是作者的经验总结与思考,也查阅了大量的资料,以下是部分参考资料:
- https://dev.mysql.com/doc/refman/8.0/en/what-is-mysql.html
- https://www.postgresql.org/docs/16/index.html
- https://survey.stackoverflow.co/2023/#most-popular-technologies-database
- https://www.toutiao.com/article/6824292543253971459/
- https://www.uber.com/en-TW/blog/postgres-to-mysql-migration/
- https://db-engines.com/en/ranking
- https://www.modb.pro/dbRank
3、作者简介
叶正盛,玖章算术CEO,NineData程序员(NineData-让每个人用好数据和云-玖章算术),原阿里云数据库产品管理与解决方案部总经理,资深技术专家,是阿里巴巴去IOE、异地多活、云原生数据库等项目核心成员。
▶︎ 附注2个数据库分类和市场大图文章来源:https://uudwc.com/A/BvP43
如要下载完整的PPT,请关注NineData公众号,回复「NineData」,直接领取。文章来源地址https://uudwc.com/A/BvP43