本文作者:qiaoqingyi

GITEE开源源码下载站(开源 git)

qiaoqingyi 2023-07-26 221

开源社区健康指的是围绕一个开源项目形成的社区中关于项目的技术迭代、社区的组织架构、成员构成、开源治理、上下游协作、社区生态、商业化等多方面的多样性与管理、运作能力状态。这些因素在指导开源项目与相应社区不断发展的过程中至关重要。

GITEE开源源码下载站(开源 git)

开源社区健康指的是围绕一个开源项目形成的社区中关于项目的技术迭代、社区的组织架构、成员构成、开源治理、上下游协作、社区生态、商业化等多方面的多样性与管理、运作能力状态。这些因素在指导开源项目与相应社区不断发展的过程中至关重要。

今天为大家介绍的开源社区健康案例是 Apache Doris 社区,其是 2022 年度 OSC 中国开源项目评选 ——「2022 中国开源社区健康案例」 获奖社区 之一。

2022 年对于 Apache Doris 是具有特殊意义的一年,6 月16 日,Apache Doris 从 Apache 孵化器毕业,正式成为 Apache 顶级项目。在项目毕业短短半年的时间内,Apache Doris 在版本迭代、指标提升、社区运营等多方面有了非常大的增长与突破,我们在实践中积攒了一些经验及案例,希望可以对你有所帮助。

一、社区简介

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等。

二、社区发展现状

2022 年以来 Apache Doris 贡献者规模呈现急剧增长的态势,1 月初贡献者为 225、11 月中已经增长至 413 人,平均每月新增贡献者近 20 人、近半年平均每月活跃贡献者达 80 人。截止目前,项目在 GitHub 累计收获了 6.6k Star,1.9k Fork,累计提交 Pull Request 总数 9.2k+,现存 Review 中未合入 PR 数为 203,累计 Closed Issue 3.5k、当前开放的 Issue 达 1.1k。

另外,截止目前为止,社区主要用户社群已经累计 10000+ 开发者,在全球范围内获得超过 1000+ 家企业的应用,在中国市值或估值排行前 50 的互联网公司中,有超过 80% 长期使用 Apache Doris,包括百度、美团、小米、京东、字节跳动、快手、网易、微博、新浪、360 等知名公司(均可提供公开案例),同时在一些传统行业如金融、能源、制造、电信等领域也有着丰富的应用。

三、社区组织

Apache Doris 社区组织内有3类角色,分别为 PMC、Committers 和 Contributors。同时还有五个虚拟组织:查询优化器、向量化执行引擎、数据湖、质量保障以及数据生态开发 SIG 小组。

四、开发者队伍

截止目前,Apache Doris 社区已经聚集了超过百家企业的近 500 名贡献者,仅 GitHub 主库贡献者就达到 407 名,其中 PMC 成员 15 名、Committer 45 名,绝大部分来自 SelectDB、百度、美团、小米、京东、腾讯、字节等一线互联网及明星创业公司。

展开全文

五、社区技术迭代

Apache Doris 目前已经发布了 16 个 Release 版本,平均 3 个月发布一个二位版本,1 个月发布一个三位版本,目前最新的版本为 Apache Doris 1.2。在 1.2 版本中,实现了全面向量化、实现多场景查询性能 3-11 倍的提升,在 Unique Key 模型上实现了 Merge-on-Write 的数据更新模式、数据高频更新时查询性能提升达 3-6 倍,增加了 Multi-Catalog 多源数据目录、提供了无缝接入 Hive、ES、Hudi、Iceberg 等外部数据源的能力,引入了 Light Schema Change 轻量表结构变更、实现毫秒级的 Schema Change 操作并且可以借助 Flink CDC 自动同步上游数据库的 DML 和 DDL 操作,以 JDBC 外部表替换了过去的 ODBC 外部表,支持了 Java UDF 和 Romote UDF 以及 Array 数组类型和 JSONB 类型,修复了诸多之前版本的性能和稳定性问题。

六、社区生态构建:

教程、文档:文档非常完备,目前文档已经覆盖 安装部署、数据表设计、数据操作、进阶使用、生态扩展、SQL 手册、管理手册、常见问题、性能测试等用户使用和运维所设计的全部内容,且每个模块展开都有非常详细的分支以及对应的讲解。

社区运维:飞轮有近 60% 的产研人员专职投入 Doris 的开发建设工作,其次,飞轮对 Doris 投入了一超过 10 人的全职技术支持团队,用于社区、社群运维,解决用户遇到的问题。

技术合作伙伴:

大数据上下游伙伴:Apache DolphinScheduler、Apache SeaTunnel(incubating)、Apache Flink、Apache Pulsar、Tapdata、CloudCanal、DataPipeline

提供 Apache Doris 托管的云厂商伙伴:百度智能云、腾讯云、阿里云、UCloud

IT 培训及教育机构:传智教育、尚硅谷

社区运营动作:

开发者社群提供全天的技术支持

每周2-3篇技术解析/用户实践干货文章输出,以供用户参考学习

每1-2周举办 1 次线上直播/Meetup活动,保持社区活跃及用户参与度

每2周一次开发者双周例会,收集用户建议反馈、同步社区最新进展

积极参加外部活动/演讲/访谈,对 Apache Doris 进行全方位宣传布道

积极参加开源榜单评选,提升对外影响力

更多开源社区健康案例可查看 【开源社区健康案例合集】仓库:https://gitee.com/gitee-community/osscommunity-cases/tree/master/2022

查看 开源社区健康案例合集

阅读
分享