转发:SAP HANA神话(4):自娱自乐的DB研究圈子

往下写故事就需要一些背景知识了,所以这一篇稍微偏点题。

关系数据库是一个近40年的东西。在计算机领域,任何一个东西如果存在了近40年而没有本质上改变什么的话,那就可以认为是一个非常非常古老的东西了。在关系数据库兴起的时候,最早做这个东西的很多人,都做出了很多贡献,这当然包括了Michael Stonebraker,也包括很多现在很有名的人,比如David Dewitt, 比如Phil Berstein,比如Paul Larson等等。然而不得不说,刚开始读PhD的时候每次开会SIGMOD VLDB台上发言的正是一群老头子,等到PhD毕业,又工作了很多年以后,台上还是那群老头子。计算机发展是如此的迅速,而这些老头子们几十年如一日的在舞台上表演,那么是这些人一招先步步领先呢,还是这些个会议其实都已经老朽不堪了呢?

某种程度上,必须说,很多很多的创新都在工业界。今天学术界,至少在数据库领域可以狠命推动整个产业前进的能力正在越来越弱。而这个圈子里面的确是一个等级森严讲究出身门第的地方。每年的博士论文拿最佳奖项的,通常来说,多少导师都得需要有点点的江湖地位。不然的话,其实是没戏的。而会议上唱主角的,则很多时候是一群老头子和老头子们的徒子徒孙们。所以当2015年Michael Stonebraker拿到图领奖的时候,整个的VLDB都洋溢在一群老头子欢欣鼓舞和一群群的人给老头子们祝福的状态。而2009年的SIGMOD则有一场关于关系代数30年的讲座,台上的老头子们忆苦思甜讲述当年年轻的他们是怎么样努力的构建了今天的这个数据库的学术圈。听着这些讲座,看着这些活动,确实会让我们这些新进来的人有无限的感慨。夕阳无限好啊,老头子们依然年轻,完全没有近黄昏的感觉。

中国人进这个圈子比较晚,然而现在也在里面发展出了自己的圈子。这个以海外澳洲,新加坡,香港,以及一些北美欧洲,最近又加入了一些中国大陆高校的老师的群体。这个团体在国内红红火火颇有面子,然而仔细观察来看,其实和美国的主流团体的老头子们,基本上还是各玩各的状态。有例外,但不多。中国人传统强项挖坑一般不在关系数据库里,比较多的是spatial,top-k,skyline,还有做做privacy。然后就是哪里热往哪里灌了。新加坡和香港一直都是这方面的主力军了。

进入Database这个领域开始做PhD的时候,正值这个圈子里面的前面一波坑退去,那个时候主流的坑一个是XML,一个是Streaming,两个每年都有很多论文发表出来。当然后来XML被证明只是个configuration的文件格式比较合适,而Streaming这几年在大数据的实际应用中确实越来越重要。然而所谓挖坑灌水,那是需要费尽心思死命的灌。灌到所有可能性都灌完。

一个新坑,probabilistic database在这两个坑灌无可灌的时候起来了。祖宗是University of Washington的Dan Suciu。Dan是一个很和蔼的长者,做理论强,数学家,发家于XML。这个大坑正式送他上天了。接下来的是Stanford的Jeniffer Widom,数据库领域两大派系之一的代表人物插了这脚进来。另外一派则是和Michael共舞的Wisconsin派。后者不论是工业界还是学术界在数据库领域都可以和stanford相庭抗理,甚至大部分时候都更牛一些。

于是乎满世界的都是probabilistic database,那几年的几乎所有的SIGMOD VLDB都在做。笔者当然也不能免俗,迄今为止,本人引用数最高的论文,大概几百个引用吧,就是关于这个坑的。中国人,包括海外的中国人尤其发挥了自身的优势,源源不断的涌现出各种各样的top-k,各种各样的probabilistic假设。

很佩服学术圈的人先赴后继挖坑灌水的能力。从大牛到小牛到不牛的大家都说这个东西好,是个大宝藏。然而必须承认,不能产生实际效益的东西无外乎皇帝的新装,总有一天会凋零的。就像SAP扛着HANA的旗帜告诉大家说,我SAP才是内存数据库的领导者,你们这群做研究的,都不知道在干什么鬼一样,这场轰轰烈烈的probabilistic database的挖坑灌水运动中,成就了无数个Phd,让无数个教授拿到了Tenure,也让一些人上了天。但是过去之后终究是然并卵,什么都没有留下来。

而自己不愿意变化,外面总是会有人来打脸的。HANA这个脸打的不算太大。有个很evil的公司叫Google,一巴掌拍过来,三驾马车一出,BigData从此走向了历史舞台。当然现在的数据库的会议都在不断的拥抱BigData,可是君不知,这些文章最初发表的会议是OSDI,一个操作系统的顶级会议。和数据库半毛钱的关系都没有。

这让笔者毕业以后越发的觉得挖坑灌水固然好玩,发论文固然有成就感,到一定程度以后就没意义了。无非是自娱自乐的一种方式。当然并不否认,国外的博士教育还是带给了笔者很多的东西,包括讲故事的能力。今天能在这里闲庭信步的给大家讲故事,而且还讲得不错,多少都得益于那惨无人道的五年里面无数次写和修改论文的过程。