无数开放题目的Amazon AWS 低级DS技术电面

上来先是code sharing。这是一个白板,也就是说不能执行代码,就是写出来给面试官看看。无比简单。
给了一个三列的表,时间、book id、书的售价。
假设每本书都只卖出一本,所有书的总收入。
book id是**----这样的格式,**代表书类目,把“书类目”这列添加到原表里。
假如这个表有很多行,就会有missing data,用所有书的平均售价去fill missing data。
书收入与时间的趋势。

你使用过的一个innovative method或者是你最proud的一个项目
linear regression和logistic regression的区别
什么是p-value,它有什么缺陷。
一个项目,你时间特别紧,来不及思考,怎么办。
你有好几个项目赶在一起,怎么办。
如何选择最好的regression model。
如何检查data quality。
我投简历的时候给了他们我的GitHub,他从上面挑了一个项目问要如何给non-technical的人讲分析的结果。

还有好些,实在想不起来了。这个职位不怎么用到ML,所以他问的ML问题也不多不难。也许onsite会提高难度。

啊还行?感谢分享!

能请问一下楼主职位名称吗