TripAdvisor DS 第一轮电面 面经

新鲜的Tripadvisor Data Science 电面之前看到了官网的职位放出,勾搭到了领英上的学姐帮忙内推的,内推1-2周后hr来约面试。
刚刚进行了面试,听口音是个很和蔼的印度小哥,不过口音不重不影响沟通。以下是整个流程
介绍他的岗位,日常工作的内容要我介绍一下我的背景(没说具体讲project,后面也基本没讲)coding背景:用什么语言,用过哪些开源包,熟不熟悉sql,hadoop,linuxmachine learning knowledge(这一块跟地里之前的面经很像)
clustering method,advantage and disadvantageunbalanced dataoverfitting, l1 l2 regularizationfeature dimension reduction (这一块之前的面经没看到,有点崩)我就说可以用pca,fa,然后说了下pca general idea。 但这里他说how to choose top k features, 我说根据特征值排序,但是我感觉这块没有听懂他的意思,结果最后他说方差贡献率(这个忘了啊,好久没用pca不记得了,只会推公式,但是不会结合实际情况解释)他说pca之后还能怎么降维,很简单的方法。我一听很简单,就说考虑feature 和response variable 的correlation,结果他说build regression model, 然后variable selection。我马上跟上来说哦对可以用step-wise 的方法,用AIC BIC 做评价标准,然后选择最好的模型(可以得到相应的变量)。
5. project 内容: 我说熟悉deep learning 的东西,然后他让我介绍了一下一个dl相关的project
6. 说再问点统计的问题
什么是hypothesis test,过程如何compute the confidence interval for population mean (normal distribution)这里把我问住了,说如果要CI for population median呢? 我突然脑子空白了,然后说应该和前面差不多,结果他说应该用boostrap,因为没有公式算median方差。我才想起来,之前做过作业,但是忘了。崩溃
7. 最后说一个case study, 其实还是统计和ml的问题
手头有一些房价数据,就是不同地点的房屋的特征和出租价格,价格应该会是什么分布?我想都没想说是正态的。结果他说可以是,但是blabla,这里没太听懂,好像大意是不同range的房价分布差异很大,然后最后我就跟他确认是不是right-skewed,他说是,我想了下说那是泊松?他说可以是泊松,就过了(感觉对分布具体的含义不熟悉,这里卡了一下)然后根据这些数据,怎么去像用户建议自己的房子该租多少,我说就回归吧,然后feature有numeric 和 categorical, 就用xgboost效果比较好(因为jd上有说要了解xgboost,所以之前疯狂学习了一下,想往这块扯)。结果他说好用这个,然后就没有了。。这case study不知道要问啥=、=

感觉,还是太菜了,很多基础的东西平时没有注意,不够融汇贯通,浪费学姐的推荐了

官网并没看到ds职位,楼主什么时候投的呢?谢谢楼主!祝好运!

现在去看已经没了,我大概是10.1投递的

好的 谢谢!

谢谢!这个职位在哪阿

boston旁边好像

谢谢lz 想问下lz找人内推了之后收到邮件通知了吗 大概隔了多久呢 谢谢!

据说是没有邮件确认的,如果有回复的话就是约你电面时间了。大概一周半后收到电面

请问楼主整个面试过程多久呢?谢谢!!

lz你好,想问下后面有没有onsite呢?想求个经验 谢谢呀~!