开源软件 Kafka 商业化公司即将上市

云计算软件开发商 Confluent 日前正式向 SEC 提交了 IPO 招股说明书。Confluent 将在纳斯达克上市交易,股票代码为“CFLT”。在 Confluent 的产品中,最有名就是开源流处理平台 Apache Kafka。当前,Kafka 每天可以传输数万亿个数据点,延迟仅为几毫秒。凭借强大的性能,Kafka 成为最成功的开源项目之一,拥有超过 6 万名来自全球的社区成员,大约超过 70% 的财富 500 强企业使用过 Kafka。

Apache Kafka 诞生自 LinkedIn 内部。当时 LinkedIn 团队在重建数据基础设施时发现,数据存储虽然已有上百种技术,但并不是最迫切的需求。最普遍的问题是要将将组成全球社交网络的所有不同应用程序和数据存储,整合成一个相互连接的软件系统,并且该系统可以对任何事情作出连续、实时的反应。但在当时几乎没有可用的商业或开源系统。于是在 2011 年,Kafka 诞生了。当意识到数据流动是整个行业都在面临的问题时,LinkedIn 在 2014 年投资约 50 万美元成立了 Confluent。

另外,从招股书中可以看出,Confluent 下一步将重点发展 Confluent Cloud 。Confluent Cloud 是该公司基于企业对 Apache Kafka 完全托管云服务的需求在 2017 年开发的云原生 SaaS 产品。

以下转自 大数据创业公司Confluent申请IPO

Confluent是Kafka这个开源软件背后的创业公司。Kafka是大数据生态里面的重要一环。相信没有Kafka的企业是不能被成为大数据企业的,谷歌除外。毕竟谷歌有GFS,大家都写在GFS上,不需要messenge queue。

Kafka最初是LinkedIn内部的项目,在LinkedIn开源。后来三位创始人就出来成立了Confluent公司。公司安身立命之本,就是用Kafka的增值服务来给客户提供价值赚钱。既有云上的服务业有云下的服务。

仔细算起来,从拆分到现在也是有7年时间了。Confluent可谓很努力。那么Confluent混的怎么样呢?看一则数据,今年第一季度,该公司的云收入,占其总收入的18%,去年同期则是12%。

在这里我就不去扯有的没的,直接拉最关键的数据。云收入只有18%,这是什么概念呢?显然,Confluent不能被称为一家云计算公司,或者云服务公司。这和MongoDB比起来是很不一样的。和已经上市的Snowflake,以及没有上市的Databricks比起来,这个数据也实在是很难看。

Confluent的估值是多少呢,看了一下大概是4.8B,约大约刚退市的Cloudera。问题是Cloudera在某种程度上,已经是线下Hadoop相关业务能够达到的峰值了。终究打不赢公有云公司黯然落幕。

Confluent所经营的Kafka呢?各大公有云当然都有自己的可替代产品和服务。用户用了公有云就不一定要用Confluent的产品了。比如亚马逊上就有Kenisis。这个东西一度卖的还很不错,当然也经常被人骂。但是不管怎么样原生的还是好。

Confluent的商业化产品和开源的Kafka有一些不同。主要是企业功能上。举一个很重要的功能Tied storage。其商业版本可以使用云对象存储作为二级存储,这样每个broker里面要存的数据就只是尾巴的一部分,可以换成SSD来存储,不仅仅速度快了而且也更稳定。

更详细的分析就不展开了,毕竟这不是一篇以技术为主的文章。Confluent的商业化,遇到了两个问题。第一是用户不是特别愿意为这些额外的特性买单。第二是用户觉得有些特性应该进入到开源的Kafka来让大家受惠。显然前者说明收入就不够高。后者Confluent不愿意干。

总之吧,Kafka是个好东西,大家都离不开。但是单独为了Kafka买单,大家又不是很想付费。所以这事情,就很尴尬了。很多公司都是自己养个团队,10来个人,搞搞自己的Kafka,有必要的时候,自己往里面加点特性什么的,就凑合着可以了。要是真的上了公有云,直接用公有云厂商提供的服务,也很香。

这个公有云的销售比例,是非常难看的。Confluent值4.8B的市值吗?我看够呛。Kafka未来肯定是继续有前途的,Confluent有没有前途,我心底里有个大大的问号。

但是没办法,现在钱印了那么多,通货膨胀很严重啊,Confluent毕竟才这么小的市值。资金炒起来,翻上天也不是不可能啊。毕竟风口上,猪也可以飞起来。长线来看,我觉得这个公司的结局可以预见。