Capital One Data Scientist 电面+timeline

找工作的时候海投了所有一二线科技公司,还有几家金融企业,其中包括capital one,因为之前看他们宣传自己是金融行业中的科技公司。
Capital One的data scientist 面试流程特别繁琐,一共5轮:

  1. HR screening,水过简历,问一下想去哪个组,对什么方面感兴趣
  2. Coding test,Hackerrank上,easy难度
  3. 一小时phone interview
  4. NYC taxi data challenge
  5. Onsite再去NYC office浪费一天

现在job market这么tight,每个人的选择都很多,真不知道这公司的HR怎么想的,弄这么多轮。

现在开始进入正题,面试是聊一个credit card churn model,地里有人分享过,我就补充下细节:

  1. Feature engineering,比如从start date算出tenure 等等
  2. Missing value
  3. 用什么模型,为什么
  4. 现在数据量加大,怎么办?spark。如果你要选,用RSpark还是PySpark?为什么
  5. 现在模型output出来,一个credit limit 使用率0%的用户和使用率95%的用户都很危险,都很可能马上就关掉信用卡,你会怎么处理?我回答churn model是起点,一般marketing department会根据churn model的结果设计retention program。对于这两类危险用户,需要设计不同的incentive plan。
         1)使用率0%的用户,基本上很难挽回。
         2)使用率95%的用户大概率可以挽回,降低利率,增加cashback等等。。。
         3)可以根据测试结果再搞个uplift model,看哪些high churn users可以挽回的,着重施加treatment。

面完第二天通知第四步,data challenge。虽然这个NYC taxi问题网上有答案,可是自己还是要花蛮多时间来改的。我问recruiter能不能跳过data challenge直接onsite,她说想都别想。那就只有算了吧,total comp还是比科技公司差了一截。。。没时间搞这个了

虽然吐槽了很多,但是这家银行至少还是比之前面过的传统银行、券商体验好。 !!!

haha想知道楼主最后去了哪里

lz,你说的地里分享过的credit card churn model 在哪里?我搜不到啊

同求,地里没找到那个model TT…

感谢你的分享