Cruise 店面

先互相介绍背景, 然后一个简单题,在codepad上能编译

given an interator of string, find thenumber of distinct words

我说可以用hash set去重, 然后被问如果提高space complexity,可以牺牲一点准确性,我说可以用bloom filter。大概问了一下bloom filter的工作原理。然后拓展到一点实操经验,如何在生产中部署和确保准确性。我回答,bloom filter有理论的准确性保证,可以在测试环境中,用接近生产的数据去验证bloomfilter的准确性。当在生产环境里,写一个内部的shadow消费者去实时检测bloom filter出来的数据,如果准确性下降,发出警报去提醒工程师。。。

当时面试官表示满意

面的是 general backend,后端组,具体不知道