找工作一段时间了, 还是没有offer, 攒攒人品,把之前面试的公司问题分享一下
Thumbtack data scientist
- 第一轮是在线的modeling, 主要考察你对数据的处理和分析能力.
给出的CSV文件,是关于用户提交一个任务后, thumbtack 记录有多少provider给了 response. 然后里面有任务(job)的一些信息,用户的信息和provider信息。
A. 给出那种job 会得到最高的response rate (hiht: 使用python group by function , 然后除以每个job 的总共的邀请人数)
B. 给出是不是不同地区会有不同的response rate, 然后问了你,为什么,给出你能想到的答案
C. 给出不同时间的response rate 是怎么变化的,为什么,你可以建模去预测response rate 吗?
2)直接就是On-site,
A. 第一轮是presentation, 讲一下你的一个project, 要和data scientist 相关
B. 第二轮是编程,都是实际工作中会遇到的,我的题目是编程实现 TF-IDF
C. 第三轮和manger谈,主要是看你对一些问题的想法,没有编程,比如说你怎么知道新的模型是成功的,(AB test)
D. 午饭是和一个engineer 谈,然后因为英文不好,又很吵,感觉很不好。
E. modeling, 给你一个数据,和一个target, 让你想办法建模。一定要对data scientist pipeline 比较熟悉-> 预处理,missing value, 对feature 编码等,然后就可以建模型,最好两个,这样可以比较。(我就是卡在这里,…)
虽然过去一个多月了,但这是第一个onsite. 希望对大家有点帮助。
希望自己和大家offer 多多!