数据类岗位细分----了解数据岗四大门派和武功要领要求

数据类岗位细分----了解数据岗四大门派和武功要领要求

在最近的求职过程中,我看到了很多文章讨论不同数据类职位之间的差异(分析师,数据科学家,机器学习工程师等)。但是,大多数文章都没有提及这些职位与公司的不同业务职能(营销,产品,研发等)之间的关系。

我了解到很多职位虽然名称一样,但要求和职责却完全不同。在数据类职位和部门业务职能之间建立一种联系,不仅可以更清晰的理清各职位之间的区别,也可以使我们更加了解自己想要的职业发展路径。我构思了一个框架来建立这种联系,希望也可以给其他数据从业者一些参考,让大家更了解数据类职位及各个职位分别将面对怎样的商业问题。

我遇到的另一个问题是,招聘人员和应聘人员对职位的理解往往存在一定差异。而且这种差异直到第二或第三轮面试才会被重视起来。因此,我想这篇文章也可以帮助招聘经理或企业所有者更清楚他们需要哪种数据专家,并且在职位描述与技能要求中明确传达这些信息,这样也可以提高申请人的素质,减少招聘过程所需时间。

我们将依次讨论以下业务职能及其相关数据类职位,分为以下四个门类:

(一)产品发展 (Growth)
(二)商务智能/运营 (BI / Operations)
(三)产品 (Product)
(四)研发 (R&D)

下面依次列举梳理:

(一)产品发展类 (Growth)

发展部门主要负责为公司发展顾客/用户/客户群。数据专家可能在此部门负责用户获取 (User Acquisition)、转化率优化 (Conversion Rate Optimization) 等市场营销项目。

1. Growth Analyst

  • 工具:Excel、SQL、Python、Looker / Tableau、Salesforce、分析工具、数字化营销工具
  • 技能:基本脚本撰写、数据分析、数据可视化、分析成果演示、AB测试分析
  • 领域知识:客户关系管理管道 (CRM Pipeline)、针对不同营销渠道的最佳实践和营销策略、用户发展相关的KPI和指标、客户细分 (Customer Segmentation)、营销活动优化 (Campaign Optimization)

Growth Analyst的日常职责主要是使用SQL和Python脚本提取大数据集,对其进行分析,以了解公司不同营销渠道的有效性,并且将分析结果(包括用户发展相关的KPI和指标)呈现给部门负责人,同时对营销策略提出改进建议。呈现方式包括演示文稿、自动化图表报告等等。

2. Growth Data Scientist

  • 工具:SQL、Python、pandas、sklearn、keras、tensorflow、分析工具
  • 技能:统计建模、AB测试设计和分析、因果推理、机器学习、研究
  • 领域知识:营销归因 (Marketing Attribution)、转化率优化、营销活动优化、营销自动化 (Marketing Automation)

Growth Data Scientist通常负责应用统计知识和机器学习算法来优化用户群的增长。例如:运用统计知识分析不同营销活动的用户转换率;使用机器学习算法划分用户群等等。

3. Growth Data Engineer

  • 工具:SQL、Python、JavaScript、云平台 (AWS, Azure, GCP)、市场营销工具SDK / API、分析工具
  • 技能:数据建模&数据结构、ETL管道、模型部署 (Model Deployment)、DevOps、API部署 (API Deployment)、网页抓取 (Web Scraping)
  • 领域知识:营销工具API报表 (Reporting APIs)、用户发展相关的KPI和指标、用户获取、营销自动化

Growth Data Engineer通常负责为Growth Analyst和Growth Data Scientist进行前期的数据获取和清理工作。除了使用API报表提取有用的营销数据外,Growth Data Engineer还需要建立和维护ETL管道,用于转换数据格式。因此,他们也需要一些后端工程师的技能,例如DevOps。

4. Full Stack Growth Data Scientist
顾名思义就是上述三个职位的集合,即负责Growth Analyst、Growth Data Scientist和Growth Data Engineer的所有职责。很多人对此并不了解就盲目申请。如果要申请这个职位,最好对上述各项职责都有能力完成。同时你要知道,在这个职位工作,由于工作范围更广,对每个项目投入的时间将比其他任何一个职位都要长。

还有一点值得注意,由于大多数数据专家的职业规划趋向于专攻一种职位,其实很难找到Full Stack Growth Data Scientist。如果你刚刚踏入数据科学领域,可以将Full Stack Growth Data Scientist作为目标,一定程度上会减少求职竞争压力。但我必须提醒你,尽管你要开发的技能范围很广,但是要深入研究这些技能还是很困难的。

(二)商务智能/运营类 (BI / Operations)

运营部门通常侧重于公司的业务成果及运营方式。在这一领域工作的数据专家需要从数据中提取有用的信息,用以制定决策。他们将从事诸如供应链优化 (Supply Chain Optimization)和财务风险(Financial Risk)之类的项目。

1. BI Analyst

  • 工具:Excel、SQL、Python、Looker / Tableau、Salesforce
  • 技能:基本脚本撰写、数据分析、数据可视化、撰写报告、分析成果演示、探索性数据分析、ETL管道
  • 领域知识:定价模型、供应链物流、人员配备物流、客户运营、财务运营、业务相关KPI

BI Analyst的日常职责主要包括提取大数据集、进行探索性数据分析、提取对制定决策有价值的信息、撰写报告以及演示成果。例如,在分析供应链物流时,BI Analysts不仅要提出供应链中的瓶颈,还应提供解决瓶颈的可行建议。另外,与ETL管道相关的经验会对数据质量检测工作起到一定帮助。

2. Operations Data Scientist

  • 工具:SQL、Python、pandas、sklearn、keras、tensorflow
  • 技能:统计建模、机器学习、网络分析 (Network Analysis)、预测、优化(整数线性规划 Linear & Integer Programming)
  • 领域知识:运营研究、定价模型、供应链物流、人员配备物流、客户运营、财务运营

3. Operations Data Scientist
通常会应用统计和机器学习算法来优化公司的整体运营。优秀的Operations Data Scientist可以通过优化财务和运营成本为公司创造真正的商业价值。例如:运用统计技术来预测不同策略下公司的财务业绩;使用整数线性规划等优化方法来分配每个项目或业务部门的最佳员工人数等等。

4. BI/Operations Data Engineer

  • 工具:SQL、Python、云平台 (AWS、Azure、GCP)
  • 技能:数据建模&数据结构、ETL管道、模型部署、DevOps、API部署、数据验证 (Data Validation)
  • 领域知识:运营研究、定价模型、供应链物流、人员配备物流、客户运营、财务运营、业务相关KPI

5. BI/Operations Data Engineer
通常负责维护用于收集、清理和存储BI Analyst和Operations Data Scientist需要的数据的基础架构。例如:负责ETL管道,使BI Analyst能够报告关键业务指标;负责确保Operations Data Scientist需要的财务数据的质量。

6. Full Stack BI Data Scientist
负责上述所有BI / Operations数据专家的职责。但是,Full Stack BI Data Scientist承担广泛职责的同时,可能很难像上述三种职业之一那样对某种职责有更深入的经验体会。

(三)产品(Product)

产品部门通常关注于公司销售的核心产品。在这一领域工作的数据专家通常会分析用户参与度数据,提取与产品使用有关的信息,用以帮助制定产品决策。他们可能进行一系列实验以获取数据,预测客户流失率、用户生命周期等等。

1. Product Analyst

  • 工具:Excel、SQL、Python、Looker / Tableau、产品设计/管理工具、产品分析工具
  • 技能:基本脚本撰写、数据分析、数据可视化、数据故事讲述、分析成果演示、探索性数据分析、AB测试、ETL管道
  • 领域知识:用户流分析 (User Flow Analysis)、分组分析 (Cohort Analysis)、产品参与度KPI (Product Engagement KPIs)、用户细分

Product Analyst的日常职责主要包括提取大数据集、进行探索性数据分析、提取对制定决策有价值的信息、撰写报告以及演示成果。例如,在分析用户转化流程时,Product Analyst不仅会提出用户转化率最小的阶段,还会将他们的发现与定性数据联系起来,解释这一现象,提出可能的解决方案,并对解决方案进行AB测试,找出最好的解决方案。另外,与ETL管道相关的经验会对数据质量检测工作起到一定帮助。

2. Product Data Scientist

  • 工具:SQL、Python、pandas、sklearn、keras、tensorflow、产品分析工具
  • 技能:统计建模、机器学习、AB测试、因果推理、模型部署
  • 领域知识:AB测试、客户流失预测 (Churn Prediction)、用户细分、转化预测 (Conversion Prediction)、分组分析、生命周期价值建模 (Lifetime Value Modelling)、产品参与度KPI

Product Data Scientist将应用统计和机器学习算法来优化产品的用户体验。例如:在进行AB测试之前和之后进行统计建模,帮助制定公司的产品策略;构建机器学习模型,以预测用户的生命周期价值。

3. Product Data Engineer

  • 工具:SQL、Python、云平台 (AWS, Azure, GCP)、产品分析工具
  • 技能:数据建模&数据结构、ETL管道、模型部署、DevOps、API部署、数据验证
  • 领域知识:事件跟踪设计与实现 (Event Tracking Design & Implementation)、AB测试基础架构 (AB Testing Infrastructure)、产品参与度KPI

Product Data Engineer通常负责维护用于收集,清理和存储Product Analyst和Product Data Scientist需要的数据的基础架构。例如:负责ETL管道,转换数据格式,方便Product Analyst分析报告产品KPI;负责设计和构建AB测试基础架构,使公司可以同时测试产品的不同版本。

4. Full Stack Product Data Scientist
负责上述所有产品数据专家的职责。但是,Full Stack Product Data Scientist承担广泛职责的同时,可能很难上述三种职业之一那样对某种职责获得更深入的经验体会。我目前的职位就是一个初创企业的Full Stack Product Data Scientist。尽管这一职位有很多不同的职责,但公司目前用户群的规模仍然很小,因此我还可以游刃有余。但是,随着用户群和公司规模的扩大,我希望可以更多地专注在Product Data Scientist或Product Analyst的职责上。

(四)研发类(R&D)

虽然研发部门的关注点因行业而异,但都是通过研究,试验和实施新技术来更好地解决客户的问题,从而为公司提供价值。研发部门的数据专家通常需要处理公司试图解决的核心问题。

1. Data Scientist

  • 工具:SQL、Python、pandas、sklearn、keras、tensorflow、自动化机器学习工具 (Auto ML Tools)
  • 技能:统计建模、机器学习、模型评估、模型部署、深度学习、转移学习 (Transfer Learning)
  • 领域知识:取决于业务/核心产品、NLP(自然语言处理)、计算机视觉、网络分析、推荐系统

研发部门的Data Scientist将花费大量的工作时间尝试、实施和改进用于产品/整个公司的核心机器学习模型。例如:研究最先进的NLP模型,将其调整为适合业务的特定用例,并测试它们是否比现有模型结果更好。在某些公司中, Data Scientist还要负责将机器学习模型应用于生产。

2. Data Engineer

  • 工具:SQL、Python、云平台 (AWS, Azure, GCP)、大数据工具 (Spark, Hadoop)、NoSQL数据库
  • 技能:数据建模&数据结构、ETL管道、模型部署、DevOps、API部署、数据验证
  • 领域知识:取决于业务/核心产品、推荐引擎 (Recommendation Engines)、数据繁重的ETL (Data-heavy ETLs)

3. Data Engineer
通常负责获取,清理和存储Data Scientist用来构建模型的大型数据集,以及构建持久的ETL管道,用于数据转换。在某些公司中,Data Engineer还要为Data Scientist提供支持,将其机器学习模型应用于生产。其次,由于Data Engineer需要与其他后端工程师紧密合作,拥有DevOps技能也非常有帮助。

4. ML Researcher

  • 工具:SQL、Python、pandas、sklearn、keras、tensorflow、自动化机器学习工具
  • 技能:统计建模、机器学习、模型评估、模型部署、深度学习、转移学习
  • 领域知识:取决于业务/核心产品、NLP、计算机视觉 (Computer Vision)、网络分析、推荐系统

与Data Scientist相似,ML Researcher将负责尝试、实施和改进用于产品/整个公司的核心机器学习模型。两者的主要区别在于,ML Researcher的工作更偏重学术。他们不仅改进和实施新的机器学习模型,而且还要对新的机器学习模型进行研究和开发。通常,ML Researcher倾向于专门研究机器学习中的一些特定领域,例如NLP或推荐系统。

5. ML Engineer

  • 工具:SQL、Python、pandas、sklearn、keras、tensorflow、自动化机器学习工具、云平台 (AWS, Azure, GCP)、大数据工具(Spark, Hadoop)、NoSQL数据库
  • 技能:统计建模、机器学习、模型评估、模型部署、深度学习、转移学习
  • 领域知识:取决于业务/核心产品、NLP、计算机视觉、网络分析、推荐系统

ML Engineer类似于以上三个职位。ML Engineer的日常职责不仅涉及实施和改进公司所使用的机器学习模型,还包括将其应用到生产中。我们可以将其大概视为Data Scientist和Data Engineer职位的混合,但ML Engineer更着重机器学习和深度学习。通常,ML Engineer倾向于专门研究机器学习中的一些特定领域,例如计算机视觉。

正如我之前提到的,这不是划分数据类职位的唯一方法。数据职位和业务职能的范围和种类都很广,因此我们提到这些职位在不同的公司职责也可能并不相同。很多职位可能是2个甚至3个这些职位的组合。但是以这种方式思考数据类职位有助于我理解不同职位可能面临的问题。

更多Data岗求职干货,内推referrals,New Grads Friendly实习/全职机会,添加微信:VS13191028 详细咨询!