十大数据爱好者必备书籍

十大数据爱好者必备书籍

转载请注明!
这是一个独一无二的书籍前十推荐,对每个十大推荐展示出顶级付费或免费书籍推荐.如果你对数据书籍感兴趣,这个列表可能合你口味.

Matthew Mayo 发表于 KDnuggets.

真正的数据爱好者阅读许多关于大数据,机器学习,数据科学和数据挖掘的书籍.除了这些技术领域,还有很多具体语言实现:Hadoop,Spark,Python,R等等,更不用说职业生活各个方面自动化的多种工具.有不少话题需要及时了解.幸运的是(不幸?)这些学科不缺乏可用的书籍.
有很多数据相关类别的畅销书名单.实际上KDnuggets 整理过数据挖掘,数据库和大数据,统计,AI和人工智能和神经网络的相关名单.但这些都是基于亚马逊狭义分类的畅销书名单,没有考虑免费的书籍.
首先,这个帖子的标题有误导之嫌.这个广泛的必备书籍列表为数据爱好者(或从业者)推荐畅销付费或免费的资源.虽然我们可能从事或其他方式涉及数量有限的数据,我们趋向于对这些数据有更好的理解.
因此,Hadoop的专家可能不需要专家级别的深度学习见解,他们对这一主题的兴趣较为短暂.本文是为了巩固兴趣,同时为希望扩大知识范围的数据爱好者提供材料建议.
请记住,在许多类别中,有些是重复的.通常材料焦点决定分类,而不是材料本身.

数据科学

畅销付费推荐: Data Science for Business

当时图了解一个新的领域,最常见的困难是寻找适当深度的书籍(资料).不是简单无用,就是繁重的学术书籍尽管权威并且全面,但注定无人问津.”Data Science for Business”恰到好处.
- m l, Amazon Review.

畅销免费推荐:The Art of Data Science

这本书简单,概括的描述了分析数据过程.作者有丰富的管理数据分析师和数据分析的经验,这本书是他经验的精华,适合于数据科学从业者和管理者.
- Official Website

大数据

畅销付费推荐:Big Data: Principles and Best Practices of Scalable Realtime Data Systems

我很少看到大数据背景下有关于数据建模,数据层,数据处理需求分析,数据架构和存储问题(伴随传统数据库的概念)实现重要性的讨论.这本书提供了令人耳目一新的全面解决方案.
- Kirk D. Borne, Amazon Review

畅销面费推荐: Big Data Now: 2015 Edition

四年内O’Reilly已经提供了年度Big Data Now报告,数据领域已经从婴儿时期成长到青少年时期.在某些领域数据是领导者,并驱动创新,而且使用数据和分析来驱动决策的公司都跑赢同行.
- Official Website

Apache Hadoop

畅销付费推荐: Hadoop: The Definitive Guide

我很欣赏这本书,涵盖高层次概念,和设计,实现和日常运行Hadoop我们需要了解的技术细节,以及各种相关技术.
- Al Gordon, Amazon Review

畅销免费推荐:Hadoop Explained

Hadoop是世界上建立于数据最重要的技术之一。了解它如何发展和进步,以这个见地指南解决大数据的持续挑战。
- Official Website

Apache Spark

畅销付费推荐:Learning Spark

互联网上可用信息是伟大的,但是这本书将这些结合到一起。如果您想像Spark程序员一样思考 - 是完全像一个程序员 - 这是开始的地方。
- Brian Castelli, Amazon Review

畅销免费推荐:Mastering Apache Spark

这个笔记的Spark使用过程中所有具体细节的集合.笔记旨在帮我们用Spark设计开发更好的产品.
- Official Website

机器学习理论

畅销付费推荐: Pattern Recognition and Machine Learning

作者是一个专家,他给出机器学习算法背后复杂的数学证明.我从事神经网络方面工作相当长一段时间,教授线性代数,概率与回归分析课程,并从这本书安静的启发中发现了一些东西。
- Sidhant, Amazon Review

畅销免费推荐:Elements of Statistical Learning

好消息是,这是相当最重要的一本书。它将所有东西连接到一起,在其他书中我从未发现。
- Enceladus Transit, Amazon Review

机器学习实践

畅销付费推荐: Python Machine Learning

这是一个奇妙的书,即使是对像我这样的机器学习初学者。看完这本书后,想到的第一件事是,完美的融合(至少对我来说)了理论和实践,以及广度和深度。
- Brian M. Thomas, Amazon Review

畅销免费推荐:An Introduction to Statistical Learning with Applications in R

这本书介绍了统计学习方法。其目的是为在非数学科学高年纪本科生,硕士研究生和博士学生。书中还包含了许多R包的详细解释,比如如何实现在现实生活中设置的各种方法,和对实践数据科学家应该是一个宝贵资源。
- Official Website

深度学习

由于付费深学习书籍的选择是目前较少,这里有两个免费选择。
畅销免费推荐:Neural Networks and Deep Learning

神经网络和深度学习是一个免费的在线图书。这本书将教你:

神经网络,确保计算机从观测数据学习
深度学习,神经网络学习中一套强大的技术

  • Official Website

畅销免费推荐:Deep Learning

在准备中,可能在不久的将来称为深度学习书的权威,作者 Ian Goodfellow, Yoshua Bengio, and Aaron Courville。开发版本每月更新,并且将免费提供,直到发布。

数据挖掘

畅销付费推荐:Data Mining: Concepts and Techniques, Third Edition

数据挖掘领域的全面概述,我认为这是研究生最好的数据挖掘参考用书。这本书的重点是技术(即,如何分析数据,包括准备),它解决了所有领域的主要问题,包括数据存储和预处理。然而,这本书是真正关心的分类方法,并在聚类分析的第二章讲述特别彻底。
- Susan Katz, Amazon Review

畅销免费推荐: Mining of Massive Datasets

这本书被设计为在未受过正规前提条件教育的本科计算机科学水平。为了支持更深入的探索,大多数章节都辅以进一步的阅读参考。
- Official Website

SQL

畅销付费推荐: Learning SQL, Second Edition

如果你正在编写任何类型的数据库驱动代码,或者你认为你不需要了解SQL,读这本书。你需要了解它,这本书教得很好。
- Jack D. Herrington, Amazon Review

畅销免费推荐:Learn SQL The Hard Way

这本书将教你SQL的80%,你可能需要有效地使用它,同时将概念混合到数据建模。如果你已经摸索构建Web,桌面或移动应用程序,因为你不知道SQL,那么这本书适合你。这是为没有数据库,编程或SQL知识的人写的,但我们知道至少有一个编程语言会有所帮助。
- Official Website

数据科学统计

畅销付费推荐: Statistics in Plain English, Third Edition

我作为一个数据分析员,每天处理基本数据统计。我希望知道所有的模型和算法。虽然统计软件处理了所有问题,搞清楚软件设置的参数成为棘手的问题。我的专业是生物技术,对于数据统计是陌生的。长话短说,我需要一个坚实的基础指南,这将有助于我适应统计的概念。
- Shyam Goli, Amazon Review

畅销免费推荐: Think Stats: Probability and Statistics for Programmers, Second Edition

想想统计强调用来探索真实数据集并回答有趣的问题的简单技术。这本书以美国国立卫生研究院的数据为例。我们鼓励读者处理真实数据集的项目。
- Official Website

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值