10 本数据求职必备书籍(附免费电子版下载地址及亚马逊购买链接)

真正的数据爱好者有很多方面需要了解: 大数据、机器学习、数据科学、数据挖掘 等等。除了这些技术领域,还要掌握具体的 实现工具和语言 ,如 Hadoop, Spark, Python 和R 等。另外还有每天接触的各种工具自动化以及职业等方向的知识。有很多话题要跟上时代的步伐,但幸运的是(也可能是不幸)关于这些话题的书并不少。

现在有很多关于数据的特定类别的热门书籍的列表。事实上, KDnuggets 在不久之前推出过 数据挖掘,数据库和大数据,统计学,AI 与机器学习和神经网络 的书籍榜单。但是这些书籍只是基于Amazon狭窄类别的畅销图书,没有编辑自由裁量权,也没有考虑免费提供的内容和电子书。

首先,让我们解决一个问题: 本书单的标题具有一定误导性 。对于数据爱好者(或实践者)来说,这个包含必备书籍的列表分别推荐了 10个类别中最好的付费和免费资源 。让我们面对现实:尽管我们的工作或多或少与参与有限数量的数据渠道,但我们且相遇理解更多渠道,这是一个兴趣与现实结合的问题。

所以,虽然Hadoop的专家或许不需要专家级别的了解深度学习,但他们很可能对于这个主题有着浓厚的兴趣。 这篇文章提供了一个计划来巩固他们的兴趣,为广大数据爱好者提供实质性建议。

请记住,这些类别中可能有许多 重叠的部分 ,这是不可避免的(参见: The Data Science Puzzled, Explained,链接:https://www.kdnuggets.com/2016/03/data-science-puzzle-explained.html)。通常,书籍的焦点决定了它的分类,而不是简单的书籍本身。

最佳付费推荐:Data Science for Business

链接:https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/1449361323

Ø “当尝试学习一个新的领域时,最常见的困难就是找到具有正确 “深度” 的书籍(和其他材料)。很多时候,一个人要么得到一本友好但基本上毫无用处、过于简单化的书,要么得到一本厚重的学术书,尽管权威而全面,却注定要坐在书架上积满灰尘。“Data Science for Business” 这点说得很对。”

—— m l, Amazon 评论

最佳免费推荐:The Art of Data Science

链接:https://leanpub.com/artofdatascience

Ø “这本书用简单易懂的术语描述了分析数据的过程。作者在管理数据分析师和让他们进行数据分析的方面都有丰富的经验,本书以一种适用于数据科学领域的从业者和管理人员的格式总结了他们的经验。”

—— 官方网站

最佳付费推荐:Big Data: Principles and Best Practices of Scalable Realtime Data Systems

链接:https://www.amazon.com/Big-Data-Principles-practices-scalable/dp/1617290343/ref=sr_1_2?ie=UTF8&qid=1458616906&sr=8-2&keywords=big+data

Ø “我很少看到在大数据背景下对数据建模、数据层、数据处理需求分析、数据架构和存储实现问题 (以及其他“传统”数据库概念) 的重要性进行深入讨论的材料。这本书为这一不足提供了一个令人耳目一新的全面解决方案。”

—— Kirk D. Borne, Amazon Review

最佳免费推荐:Big Data Now: 2015 Edition

链接:https://www.oreilly.com/library/view/big-data-now/9781492048091/

Ø “在奥莱利(O ‘Reilly)发布年度 “Big Data Now” 报告的四年里,数据领域已经从婴儿期成长为青年期。如今,数据在一些领域处于领先地位,在另一些领域则是创新的驱动因素,而那些利用数据和分析来推动决策的公司,其表现也超过了同行。 ”

——官方网站

最佳付费推荐:Hadoop: The Definitive Guide

链接:https://www.amazon.com/Hadoop-Definitive-Guide-Tom-White/dp/1491901632/ref=sr_1_1?s=books&ie=UTF8&qid=1458240299&sr=1-1&keywords=hadoop

Ø “我很欣赏这本书涵盖了高级概念,并深入探讨了设计、实现和Hadoop及其各种相关技术的日常运行所需的技术细节。”

—— AI Gordon,Amazon评论

最佳免费推荐:Hadoop Explained

链接:https://www.packtpub.com/free-ebooks/hadoop-explained

Ø “Hadoop 是基于数据的世界中最重要的技术之一。通过这本有见地的指南,你可以了解Hadoop是如何发展和进步的,以应对大数据的持续挑战的。”

——官方网站

最佳付费推荐:Learning Spark

链接:https://www.amazon.com/Learning-Spark-Lightning-Fast-Data-Analysis/dp/1449358624/ref=sr_1_3?s=books&ie=UTF8&qid=1458617385&sr=1-3&keywords=spark

Ø “互联网信息是宏大的,但这本书把它的大部分集中在一个地方。如果你想学习像Spark程序员那样思考和“不”像程序员那样思考——从这里开始。”

—— Brain Castelli,Amazon评论

最佳免费推荐:Mastering Apache Spark

链接:https://legacy.gitbook.com/book/jaceklaskowski/mastering-apache-spark/details

Ø “这些笔记 (有些人可能会轻率地称之为“书”) 是我收集使用Apache Spark的所有细节的地方。这些笔记的目的是帮助我用Spark设计和开发更好的产品。”

——官方网站

最佳付费推荐:Pattern Recognition and Machine Learning

链接:https://www.amazon.com/Pattern-Recognition-Learning-Information-Statistics/dp/0387310738/ref=pd_sim_14_3?ie=UTF8&dpID=61zEpn8lkRL&dpSrc=sims&preST=AC_UL160_SR119%2C160&refRID=0YKF6BBKFHMTMSYJNQ3V

Ø “作者是一位专家,他对机器学习算法背后的复杂数学给出了出色的见解。我研究神经网络已经有一段时间了,也修过线性代数、概率和回归分析的课程,发现书中的一些内容很有启发性。”

—— Sidhant,Amazon评论

最佳免费推荐:Elements of Statistical Learning

Ø “好消息是,这几乎是我在整个太空中度过的最重要的书。它用一种前所未有的方式吧所有的知识紧密的联系在一起。”

—— Enceladus Transit,Amazon 评论

最佳付费推荐:Python Machine Learning

链接:https://www.amazon.com/Python-Machine-Learning-Sebastian-Raschka/dp/1783555130/ref=sr_1_3?s=books&ie=UTF8&qid=1458240009&sr=1-3&keywords=data+science+from+scratch

Ø “这是一本很棒的书,即使对于像我这样的机器学习新手来说也是如此。读完这本书,我首先想到的是它是理论和实践的完美结合(至少对我来说是这样),它的广度和深度也是如此。”

—— Brian M. Thomas, Amazon评论

最佳免费推荐:An Introduction to Statistical Learning with Applications in R

链接:http://faculty.marshall.usc.edu/gareth-james/

Ø “这本书介绍了统计学习方法。该课程面向非数学科学专业的高年级本科生、硕士生和博士生。本书还包含了许多R labs,详细解释了如何在现实生活中实现各种方法,是一个实践数据科学家的宝贵资源。”

——官方网站

最佳免费推荐1:Neural Networks and Deep Learning

链接:http://neuralnetworksanddeeplearning.com/

Ø 这本免费的在线书籍将教你:

1)神经网络,一个美丽的受生物学启发的编程范例,它使计算机能够从观测数据中学习;

2)深度学习,一套强大的神经网络学习技术。

最佳免费推荐2:Deep Learning

链接:http://www.deeplearningbook.org/

Ø 本书由伊恩·古德费洛、约舒亚·本乔和亚伦·库维尔合著,目前正在筹备中,很可能是近期的权威深度学习书籍。开发版本每月更新一次,在出版之前免费提供。深度学习,一套强大的神经网络学习技术。

最佳付费推荐:Data Mining: Concepts and Techniques, Third Edition

链接:https://www.amazon.com/Data-Mining-Concepts-Techniques-Management/dp/0123814790/ref=sr_1_3?s=books&ie=UTF8&qid=1459461204&sr=1-3&keywords=data+mining

Ø “数据挖掘是对该领域的全面概述,我认为它最好是作为数据挖掘的研究生课程,或者作为参考书。这本书的重点是技术(即怎样分析数据,包括准备工作),并涉及该领域的所有主要主题,包括数据存储和预处理。然而,这本书实际上是关于分类方法的,其中关于聚类分析的两章特别有力和深入。”

—— Susan Katz,Amazon 评论

最佳免费推荐:Mining of Massive Datasets

链接:http://www.mmds.org/

Ø “这本书,就像这门课程一样,是在本科计算机科学水平上设计的,没有正式的先决条件。为了支持更深入的探索,大部分章节都补充了进一步的阅读参考资料。”

——官方网站

最佳付费推荐:Learning SQL, Second Edition

链接:https://www.amazon.com/Learning-SQL-Alan-Beaulieu/dp/0596520832/ref=sr_1_4?ie=UTF8&qid=1459462913&sr=8-4&keywords=sql

Ø “如果你正在编写任何类型的数据库驱动代码,并且认为不需要理解SQL,那么请阅读本书。你需要理解它,这本书教得很好。”

—— Jack D. Herrington,Amazon评论

最佳免费推荐:Learn SQL The Hard Way

链接:http://freecomputerbooks.com/Learn-SQL-The-Hard-Way.html

Ø “这本书将教你80%的SQL,你可能需要有效地使用它,并在同一时间将概念混合在数据建模。如果您一直在摸索构建web、桌面或移动应用程序,因为您不了解SQL,那么这本书很适合您。它是为没有数据库、编程或SQL知识的人编写的,但至少了解一种编程语言将有所帮助。”

——官方网站

最佳付费推荐:Statistics in Plain English, Third Edition

链接:https://www.amazon.com/Statistics-Plain-English-Third-Timothy/dp/041587291X/ref=sr_1_4?ie=UTF8&qid=1459462132&sr=8-4&keywords=statistics

Ø “我是一名数据分析师,每天处理统计数据。我需要知道所有的模型和算法。虽然统计软件能帮我做所有的事情,但计算出软件能算出的数字却成了棘手的部分。我的专业是生物技术,在我生命的大部分时间里,我对这些统计数字都是陌生的。长话短说,我需要一个坚实的基础指南,帮助我适应这些概念。”

—— Shyam Goli,Amazon评论

最佳免费推荐:Think Stats: Probability and Statistics for Programmers, Second Edition

链接:https://greenteapress.com/wp/think-stats-2e/

Ø “Think Stats强调简单的技术,您可以使用这些技术来探索真实的数据集并回答有趣的问题。这本书用美国国立卫生研究院的数据做了一个案例研究。鼓励读者使用真实的数据集进行项目实践。”

—— 官方网站

原文作者:Matthew Mayo,KDnuggets

原文链接:https://www.kdnuggets.com/2016/04/top-10-essential-books-data-enthusiast.html

1 Like