脸书 FB Data Scientist挂经

之前面了 FB Data Scientist 一路到 onsite 最后没表现好 来贡献一份面经希望可以帮到大家。timeline 大概一个月内走完,可以走快一点,我刻意拖了一个礼拜。觉得 FB 节奏还是蛮快的连 HR 节奏也特别快。onsite有签nds只写了个大概。但整体面试感觉非常好,面试官感觉都很厉害而且非常友好。

HR phone screening
介绍组、介绍职位、问了工作内容都用什么语言然后简单问了 SQL,有一题比较tricky

  • explain inner join, left outer join, full outer join-baidu 1point3acres
  • A: student_id, address, B: student_id, name
    • when doing inner join, if you get more rows than expect, why?
    • when doing inner join, if you get less rows than expect, why?

1st Phone-Interview
SQL
三张 tables 分别是 (user_name, sports), (userid, user_name, registration date), (follower id, followee id, following date)

  1. How many people are following each sports category?
  2. How many basketball players are following football players?
    Product
    We have a team that works on internal troubleshooting cases from clients. Assume that the reps prioritize cases based on a first come first served model and that you would now be responsible for prioritizing cases. How would you build a ranking system to prioritize cases?

Onsite

四轮

  1. 产品:如何区分在地商家

  2. 产品:SGB 收入下降你该怎么办?

  3. SQL:满基本的各种 join 和算 histogram,主要是要注意 edge cases

  4. Statistics:三个 AB Testing 的 CI 怎么解读?Bais-Variance Tradeoff 解释。

在地商家指的是 local business 而非星巴克这种国际连锁店,fb 有很多商家,问你如何区分在地商家和非在地商家

sbg 不是很重要,可以想像fb 有个 dashboard看revenue ,看到这条 revenue 线一直下降,问你该怎么办

想问一下ab testing应该用one-sided testing还是two-sided testing?比如我们希望一个新feature可以增加用户timespent
比如
h0: timespent/dau in control = timespent/dau in experiment group
还是
h0: timespent/dau in control <= timespent/dau in experiment group. 1point3acres
如果是oneside的话,alpah还应该说5还是2.5%呢

一般two side 5%是default。答的时候可以补充一句one side,让面试官感觉你知道这两个的区别。

多谢楼主分享, 请问你是专门面SBG的吗, 还是general hire?感觉你的面经题目都是偏SBG组里的…我记得我HR发的邮件里面专门说了不会涉及ML相关的问题, 但是居然还考了你bias-variance trade off…感觉有点不按常理出牌

对的,是专门面 sbg 的,我觉得其实 ml 和 stats 有很大的 overlapping 而且问的都是满基本的,所以我觉得也不太算超出范围

请问楼主onsite完大概什么时候收到消息?昨天刚面完这组, 唯一不同的问题就是被问到了一道概率题。

一週內有消息,很快。

请问楼主一轮面试的product怎么答得呀?

我覺得我回答的一般般,還是別獻醜以免誤人歧途。
但基本上要注意各種 follow-up 問題,回答一定要想清楚不能夠想到什麼講什麼,我面 FB 的感覺就是面試官都追問很細,你一旦丟出一個想法他們會一直問你讓你 justify 而且要合理與確認真的可行。而不是隨便拋出來的點子。

这问1. How many people are following each sports category? 指的是当天吗?

不管 date 就算 group by sports count(distinct user)

这问2. How many basketball players are following football players?怎么知道谁是basketball players 谁是football players 啊?

第一个 table 有资料

求问楼主三个 AB Testing 的 CI 怎么解读?是什么意思?非常感谢!

三條 CI 的線,有長有短,位置各不同,跟你說這是 AB testing 的結果,問你怎麼解讀為什麼會有這些差異,要怎麼下結論

请问统计问题里的Bais-Variance Tradeoff 解释是纯解释概念还是给了个问题让你分析其中的bias / variance?

一開始先問,我們在 training 的時候 error 的曲線是怎麼樣,那你覺得 validation 的曲線是怎麼樣,為什麼是這樣,接著很多針對 bais-variance 的 follow-up

感謝樓主分享 :slight_smile:

小白請問 “三个 AB Testing 的 CI 怎么解读?” 這裡的三個是指哪三個? CI 又是什麼意思呢?

謝謝!