Capital One Data Scientist 电面+timeline

cf36987 · 2018 年11 月 13 日 03:56

找工作的时候海投了所有一二线科技公司，还有几家金融企业，其中包括capital one，因为之前看他们宣传自己是金融行业中的科技公司。
Capital One的data scientist 面试流程特别繁琐，一共5轮：

  1. HR screening，水过简历，问一下想去哪个组，对什么方面感兴趣
  2. Coding test，Hackerrank上，easy难度
  3. 一小时phone interview
  4. NYC taxi data challenge
  5. Onsite再去NYC office浪费一天

现在job market这么tight，每个人的选择都很多，真不知道这公司的HR怎么想的，弄这么多轮。

现在开始进入正题，面试是聊一个credit card churn model，地里有人分享过，我就补充下细节：

  1. Feature engineering，比如从start date算出tenure 等等
  2. Missing value
  3. 用什么模型，为什么
  4. 现在数据量加大，怎么办？spark。如果你要选，用RSpark还是PySpark？为什么
  5. 现在模型output出来，一个credit limit 使用率0%的用户和使用率95%的用户都很危险，都很可能马上就关掉信用卡，你会怎么处理？我回答churn model是起点，一般marketing department会根据churn model的结果设计retention program。对于这两类危险用户，需要设计不同的incentive plan。
         1）使用率0%的用户，基本上很难挽回。
         2）使用率95%的用户大概率可以挽回，降低利率，增加cashback等等。。。
         3）可以根据测试结果再搞个uplift model，看哪些high churn users可以挽回的，着重施加treatment。

面完第二天通知第四步，data challenge。虽然这个NYC taxi问题网上有答案，可是自己还是要花蛮多时间来改的。我问recruiter能不能跳过data challenge直接onsite，她说想都别想。那就只有算了吧，total comp还是比科技公司差了一截。。。没时间搞这个了

虽然吐槽了很多，但是这家银行至少还是比之前面过的传统银行、券商体验好。！！！

byd6540 · 2018 年11 月 13 日 03:56

haha想知道楼主最后去了哪里

999999 · 2018 年11 月 13 日 03:57

lz，你说的地里分享过的credit card churn model 在哪里？我搜不到啊

0572C · 2018 年11 月 13 日 03:58

同求，地里没找到那个model TT…

data123 · 2020 年7 月 17 日 01:41

感谢你的分享