微软Data scientist电面

说出来大家可能不信,不过面试题确实是这样的:

  1. 一个web,QPS是100,假如现在有attacker攻击网站,如何设计数据库来prevent attacker
    回答:在master里加入一个threshold,大概3倍 peak QPS
    followup,可以用除了QPS之外的threshold吗?
    回答:I/O,我觉得不可以用memory或者CPU,因为有些query比如join 会消耗很多memory

  2. 如何去observe一个distributed system 在跑tasks时候的performance
    回答:1)plot input/output I/O vs time; 2)average time,但是要讨论fault tolerance; 3)我个人经验有时候会看memory,因为C++会面临memory leak的问题,对于java就不一样了

然后先聊了一下MS的project,我特地问了他说DS为啥问系统,他说工作中会用到的。

补充内容 (2018-11-17 08:50):
补充一下,第一问还需要根据RPC的IP地址进行[定位]