纽约老实人的Data Science转行心得(劝退指南)

最开始了解数据科学这个领域也是在知乎上,大约是2015年的时候,之后就开始了漫长的转行之路。主要原因倒不是媒体吹捧的工资高酷炫AI什么的,确实有热情和兴趣在里面。所以即使找全职的时候市场行情不太好,有考虑过刷题转SDE或者从BA之类的做起,或者做本专业最对口的quant,但还是坚持找DS。幸运的是一路有很多朋友给了我许多帮助,最后如愿在纽约找到了一份DS的工作。

转行的过程中知乎的帮助也很大,包括从各路大神的文章和答案中取经。我几年来也没有在知乎上输出什么内容,毕竟自己太菜。这次终于有机会“反哺”,和大神聊了聊行业情况,准备把自己求职中的一些心得想法记录一下,提供给考虑转行的同学们作为参考。

这份心得主要适用于在北美读书,希望在北美就业的同学,特别是那些背景不是很match的同学。对口方向的名校PhD(包括CS,stats,OR等)和CS强校的对口master(CS, ML)大神们,no worry,你们依然是“炙手可热”,横扫几个offer不成问题。

  1. 为什么叫劝退贴

数据科学大热差不多是在2015年左右。在2015到2017年这个阶段市场行情火爆,需求大从业者少,相对来说找到一份DS的工作不是那么难。但是在2018年不再是这样了,对于转行的同学来说,找一份entry level的DS工作非常困难。原因基本可以从供应和需求两部分来分析。

2. Supply is too much?

自从2015年以来Alpha Go大热,各路媒体吹捧,很多同学(包括我)都涌入这个行业。如果大家浏览未来五年,数据科学家(Data Scientist)的岗位需求会如何变化?类似的帖子会发现,DS行业的高端人才还是很稀缺的,但是整体供应量逐年升高。如果你在美国读master,在找DS工作时候面临的竞争有:

  • 核心专业的同学(对口PhD和master,比如CMU Ms in ML)
  • 其他方向的PhD同学,比如EE(这个还算对口了),生物,材料,化学,甚至policy等文科方向
  • 其他专业的master同学,比如EE,OR,stats,数学,各种和data交叉的项目(很多)

第一类同学主申的项目和我们都没有什么关系,比如FB core DS,Airbnb Algo这种,基本不会有回复。问题是第二类和第三类同学加起来基数非常大,大部分没有DS或者quantitative role的工作经验,大家找的都是entry level DS的工作,简历完全淹没在大海之中。

换句话说,如果你手握NIPS/KDD/EMNLP这些会议,拿到面试不成问题(我不止一次面试的时候遇到有NIPS的大神小伙伴)。但是如果你的DS经历不太丰富,只上过几门Python和吴老师的机器学习,想过简历关不太现实。

3. Demand有,不是entry level

Supply的问题还要结合demand。我在秋招之前觉得现在任何公司都需要DS,肯定有大量面试等着我。然而很快我发现问题了: Data Scientist是一个特别需要real industry experience的职业 。你可以在领英上找到很多DS的职位,但是投完大部分石沉大海。因为这些职位基本都是社招岗位,很多都需要至少1年以上的工作经验。基本上那些传统企业比如银行,或者一些中小型的公司,startup,都只想要有经验的人来了直接撸袖子干货,而没有精力培养新人。

那走校招怎么样呢?部分大公司特别是科技公司是有校招的,也就是在“University”这个类别下的Data Science New Grad。这种确实有,数量也不算少,但是和supply相比那就竞争太激烈了。不过如果有一些DS的经历,这部分还是能拿到一些面试的,可能要看refer和背景是否match的情况了。

校招另一个坑就是会有很多OA(online assessment)来做,这部分我做了大概10+ OA,只有两家转化成后续面试,其中一家还是我随便做的,hirevue录像都黑乎乎的,应该是简历match通过的。我猜测大部分公司校招OA都是群发的,导致求职的时候可能每个校招都有OA,但是花时间做完了也石沉大海。好处是可以练习coding和一些ML的知识。

DS的一些职位也会有data challenge,或者叫case study。DS challenge稍微好一点,一般是HR已经对你有兴趣之后让你做,一般大概花上几个小时甚至更多。这部分我的通过率是百分之百。后续经常会follow要求present这个challenge给组里的人,作为面试的一部分。

社招有的时候也会要求做case。总的来说社招海投的成功率很低,如果JD上明确了2+ experience的话基本是没戏的,3+以上的我就直接过滤掉了。关于经验的要求可能要看hiring manager的意思,我也面过一些senior的职位(虽然都挂了)。但是某些大公司就会把校招和社招分开,new grad只看校招。比如某今年准备上市的独角兽,因为好心学姐给了我一个strong referral,所以HR联系了我,但是后来因为hiring manager的硬性要求是master+1 yr exp或者PhD,所以没有进入面试流程。很遗憾,但是fresh master真的很苦逼。。。

除此之外,DS行业还有一个伪需求的问题。说到DS,大家想到的都是什么深度学习,Alpha狗。但是实际上,别说DL,ML对于很多公司来说其实是没有用武之地的。对于一些公司DS, Analytics其实是偏BA,另一些公司是做AB testing的统计分析型,比如我面过某家SF的公司,做的产品是2B的,横向对比slack,他们产品不需要太多ML的功能。对于很多DS职位来说,学那么多ML用不上,还不如多复习一下大一统计课的统计推断呢。

4. 吐槽了这么多,有什么建议?

  • 对于不是一心想钻进DS行业大坑的同学:

如果一定要在美国就业,最好找工作的还是SDE(software engineer)。多刷刷题,总能找到,几乎所有公司都需要SDE。

如果还是想做data相关,可以找BA/BI,技术好一点的可以做DA。DA会对SQL要求很高,一般也需要一些python。虽然很多公司对于DS是伪需求,但是他们真的需要DA呀!虽然待遇可能比DS差一点,但是入行之后有了工作经验可以升职转DS。

  • 对于DS忠实爱好者:

提早准备,建立好自己的background。如果是year 1抓紧找实习,DS的intern机会相比full time会多一些,因为很多公司都直接走return不怎么对外校招了。做一些有质量的project,这样找人refer的时候言之有物,不要自己没有什么经历就希望对方给refer。最好在某个ML的领域有一定specialization,比如NLP, CV, fraud detection, marketing DS等等,这样会更match一些职位。

至于面试准备就见仁见智,大概就是ML/简历/算法/python/SQL/结合实际问题的case question/偶尔一些数学题。DS还有一个坑就是面试的题库范围太广了,什么都能问。多面试,多积累,后期就有信心了。

10 Likes

说得非常中肯了 谢谢分享心得:heart:

謝謝樓主分享,但我有一點想提出,我認為BI的需求比不上DS,況且公司真的需要BI的話,可能會偏好招contractor來解決問題,而且也不願意sponsor BI。

1 Like

哈哈哈 谢谢分享! 感觉很合适,本来看到铺天盖地的ML吓死了! 不过2019了,想请问楼主知不知道现在市场情况如何?

感谢老实人分享!真的非常非常真实了

感谢分享,希望平台也越做越好