职位:Associate Data Scientist - New Grad
这家公司是数据供应商,面试官说他们家的 data scientist 有三种不同path: software engineer, product 和 machine learning.
但给我整体的感觉是,这个岗位更偏向数据抓取,数据整合,以及 validate 数据准确性
面试流程:
-
coding – 给两个数据集,根据面试官要求整合成一个新的数据集。
题目本身其实挺简单的,但可能需要关注的点是尽量减少额外空间的占用。
(因为我就是新建了一个 list 存新的数据集,面试官好像觉得浪费了空间,但我不是很确定是不是这个点不好) -
brainstorm – 给你10条 place 数据(包括地址,经纬度等等attributes,如何核实数据的准确性,也就是这个palce是否真实存在。
(这种类型的题目根本不知道怎么答。我的想法是找多个数据源 比如google map 搜索地址,看是否有这个place。
面试官希望我再多想想其他数据源,想不出,于是让我直接Google一个地址,发现会有 Yelp, Tripadvisor等第三方的链接。)
整体体验还好,面试官不会很刁难。但像 2 这样的问题,该怎么去分析,希望地里有人能够帮忙解答。