Trip Advisor Data Scientist 电面

今天上午面的Trip Advisor Data Scientist 面试。面我的是一位和善的巴西哥哥,一听口音就和我们系一个巴西老师一模一样,职位好像是Lead Data Scientist 管一个大组,本人是MIT的博士后,感觉碉堡了。

前边就是瞎哈拉,聊了一下TripAdvisor都在做什么。然后就是过简历,问了问一个曾经做过的Machine Learning的Project, 问了问怎么处理NLP细节,用了哪些Metrics evaluation. 如何改进。然后你用Python还是R,用过哪些包,会不会Spark之类的。
第二部分就是概念题,什么是bias variance tradeoff. 什么是L1, L2 regularization. 区别和特点有什么不同。你知道什么clustering 办法,K-means有什么缺点和好处。如何确定K-means的K。
第三部分Case Study, 假设TripAdvisor有一个租户要出租自己的房子,没有之前的data, 我们需要哪些数据和特征来建立模型给这个房子定价。定价用什么模型,如果包含文本信息和图片信息的话,如何把这些信息也加入到模型中。

感觉是一次亲切而又愉快的交谈。