Data Science申请总结

楼主背景-藤校毕业,在high-tech当data scientist两年,工作主要是NLP和Deep Learning相关。自己是全DIY申请,所以一些经验分享给大家~全部都是自己手打的,希望大家多加米哦!有什么问题可以留言或私信,我有空就会回复哒!
(1)Data Science专业介绍

数据科学是近期很火的专业,它主要是学习基于Python为主的编程语言,涉及Machine Learning, Deep Learning, Natural Language Processing, Data Visualization, Big Data analytics等方向。毕业工作以High-Tech (如Facebook, Uber, Amazon) 为主,Fin-Tech为辅,并且几乎每个大公司均设有职位。年薪12万美金左右(根据Indeed数据),会根据不同城市消费水平浮动。

(2)Data Science 学校设置
US NEWs综合排名前20的学校开设data science专业的有:Harvard (MS in Data Science), Columbia (MS in Data Science), Stanford (MS in Statistics, Data Science), UPenn (MSE in Data Science), Duke (Master in Data Science), JHU (MS in Data Science), Brown (MS in Data Sceince), Cornell (NPS in Information Science -Data Science), U Notre Dame (Ms in Data Science), Georgetown U (Ms in Data Science for Public Policy)
我总结了一个complete list的excel,不知道怎么上传 =。=, 有需要私信(私信可以传么?)

(3)Data Science 申请背景
大部分申请是理工科专业的同学,根据以往申请经验,GPA和GT不是录取的重点,data science专业主要是看文书(简历和个人陈述)是否能展现很强的data science的技能。必须要突出的是machine learning的技能,在写得时候要写出专业的词汇和专业的深度。我们对比以下两个version的描述:

【version1】我在腾讯实习的时候利用了大数据进行用户分析,利用机器学习为游戏装备销量提升提出建议

【version2】作为腾讯实习生,我处理两百万个用户数据,进行深度数据清理后,利用24个features建立一个gradient boosting的分类器,预测每个用户购买游戏装备的概率,达到89%的准确率和80%的F1值。后期我进一步利用卷积神经网络的深度学习方法,提高到93%的准确率和85%的F1值。这个预测为marketing提供target potential customer的指导。

以上纯属我编造的,但是大体思路就是这样,一定要具体和有专业水准内行人大部分能通过你的简历就知道你这个专业程度如何,你有没有专业错误。

(4)Data Science 工作介绍
data science的工作分为两种,一种偏向于analytics(比如facebook),一种偏向于research(比如google)。前者主要是处理数据和简单建模(比如直接调用sklearn这样的package),有40%的时间会和product manager或者business people开会,分析data给公司做决策。后者主要是建立硬核的模型,大部分的时间是在模型开发上。

我谈一下做了快两年的data scientist,我的想法。我的工作是偏向research,90%的时间是开发模型。比如说利用deep learning做text classification,也有比较激动人心的text summarization项目。其实我真正开始好好学编程是来美国读master的时候才开始的,python和data science都是非常好入手的一个学科。它不像computer science,做出来了就做出来,做错了就是错了。data science之所以叫science,就是他没有绝对的对错,永远不会有100%的accuracy,所以自己有很大的自由去处理数据,这还是蛮吸引我的。所以如果你现在还没有很强的背景不要担心,一步一步来,上手很快的!

(5) Data Science兄弟专业
很多申请data science的还会申请这些专业:statistics,data analytics,business analytics,information systems management,engineering management。每个专业其实都有点不一样,但又有很多共同点。这几个专业毕业都能去当data scientist,关键就是在于学校提供的和data science相关的资源的多少不同,有的需要多靠自学(比如engineering management),有的会上一些没有特别大相关性的课程(比如statistics)等等。所以选择专业上主要要看你自己以后偏向的是analytics/business还是research/engineering。我从engineering management(data analytics方向)毕业走的data science,但是我大部分的技能是通过自学来的,学校主要提供了一个藤校的牌子和实习的机会。

不论哪个专业,学data science是一个不断与时俱进的专业,每个月都会有新东西出来,所以路漫漫其修远兮,吾将上下而求索!

(6)怎么自学data science

  • Python学习:dataquest

  • Machine Learning学习:coursera Andrew NG

  • 项目实战:Kaggle,多去看kernel学大神的code

  • Deep Learning学习:看书+看paper

  • 最近好paper推荐:attention is all you need 强推

为什么回答都这么短?

  • 因为我说再多,你没有决心学习都是白费,各种学习资源网上都有呢 :smiley:
3 Likes

讲的很好呀!谢谢博主!
能方便提供ds选校list的excel到我邮箱吗 924694890@qq.com 谢谢啦~

赞!今年也申请DS,博主可以发给我LIST嘛,蟹蟹蟹蟹~zhangchenyu555@gmail.com