领英 DS onsite 跪经

onsite 完了一个月后收到拒信楼主平时在公司都是做DE+ML的 所以 analytics做的不多 但是 因为本身对product非常感兴趣 决定跳槽并且试一试领英DS职位
虽然这次面熟挂了 但是 在准备面试这几周复习到了很多东西 并且让楼主有机会考虑到很多不同的问题 所以 无论怎样 还是非常感恩

onsite 面了4轮

  • 两轮stats
  • 一轮coding
  • 一轮case

1.coding
具体题不太记得了 就是两个 table join 求ratio, 基本上就是 left join,group by, count
题是楼主没有在面经上看到过的 但是不难

  1. case
    case 面的也比较轻松, 因为面试官来晚了10 分钟 所以 没有时间 deep dive, 问的是怎样 assess newsfeed, metric 要用哪些 - 基本上就是 engagement 和 revenue 角度出发 说了很多 metrics

  2. stat 第一轮
    问了怎样 estimate user 的 secondary connection, 这里被问到了 用 mean versus median, 能不能用median, median 是不是unbiased, median的variance versus mean 的 variance,以及一些 AB test 的问题 具体问了什么记的不是很清楚了
    感觉这位面试官很面试 style 很 random,整体没有一个很好的 structure, 问了一个问题 还没给我时间好好解释 就开始问到下一个问题了 总体体验不是很好

  3. stat 第二轮

  • bias-variance trade-off
  • 怎样 prevent overfitting while using the tree-based model
  • OLS 的 beta 为什么是 unbiased
  • 为什么 L1 L2 不是 unbiased
  • 怎么evaluate model result

这位面试官一直面无表情, 感觉他已经很疲惫了,一直没有 eye contact,这一轮儿没有任何 case context。 被问到 tree-based model 怎样 prevent overfitting, 楼主说到了 leaf nodes samples size, number of trees, 以及 number of features 和 number of observations, 后来 面试官问为什么要adjust 这么多。。 楼主认真解释 但是面试官表示不是很理解 楼主猜测面试官对 tree-based 的model并不是很熟悉。。。

总体感觉气场不和 再加上楼主没有好好准备OLS 临场发挥不是很好

总体感觉年龄大一点的面试官会引导 不是 all over the place。 有一些年轻的面试官自己心里已经有一个答案 如果 没有答到他/她想要的点 就会不耐烦 表情会很明显
但不管怎样 这次面试对于楼主来说是非常宝贵的经验 希望这些面试题能帮到大家