关于数据科学的十本好书

 1. Python Machine Learning

  

深度学习

 

  Python 是建议数据科学家应该学习的最顶尖的语言,掌握这种技能协商薪水时能得到更多。对任何数据科学家,特别是有抱负的数据科学家,或想要把 Python 作为技能掌握的开发者而言,这本书就是你的必读书目。这本书将帮助读者利用学习深度学习、数据整理、可视化数据的 Python 开源文库。它还能提供学习策略和实践,从而改善、优化机器学习系统和算法。

  作者:Sebastian Raschka

  价格:Kindle 版 22.39 美元,纸质版 40.47 美元

  2. Data Analyti cs Made Accessible

  

深度学习

 

  这本书为读者提供了数据分析的整体概况,所以对于想要在此领域学习更多的人,或是对需要一本初级读物并理解相关技术如何工作的经理人来说,它都是一本好书。这本书在每章开篇提供了小案例研究,并为数据挖掘技术和平台提供了一个整体概览。这本书也为了解 R 统计分析平台提供辅导。

  作者:Anil Maheshwari

  价格:9.99 美元

  3. Dat a Smart: Using Data Science to Transform Information Into Insight

  

深度学习

 

  这本书是由 MailChimp.com 首席数据科学家撰写,集中论述了如何用微软 Excel 从数据中获得洞见,所以不要期待在这本书中学到 R 语言、Hadoop 或是 Apache Spark。但是在这本书里你将学到如何掌握 Excel 从而在数据设定中得到更多信息。

  作者: John W. Foreman

  价格:Kindle 版 22.99 美元,纸质版 27.99 美元

  4. Da ta Science For Business

  

深度学习

 

  本书是基于纽约大学 MBA 课程编写而成,作者也是教授这一课程的讲者之一。它介绍了数据科学的基础、并引导读者获取从数据中寻找商业价值需要的「数据分析思维(data-analytics thinking)」 。本书探讨了如何以数据挖掘技术和数据使用来获得竞争优势。

  作者:Foster Provost 、 Tom Fawcett

  价格:Kindle 版 21.49 美元,纸质版 37.99 美元

  5. Hadoop: The Definitive Guide

  

深度学习

 

  想要学习 Hadoop?那这本书就是你需要的。这是出版于 2015 年的第四版。本版专门使用了 Haddop 2 并增加了新的章节描述 YARN 和 Hadoop 相关项目,比如 Parquet、Flume、Crunch、Spark。另外,本书覆盖了 Hadoop 的基础内容,MapReduce、HDFS 和 YARN。也阐述了如何建立并维护在这三个基本成分上运行 Haddop 集群。本书讨论的其他主要技术包括 Pig、Hive、Crunch、HBase 和 ZooKeeper 等。

  作者:Tom White

  价格:Kindle 版 24.99 美元,纸质版 32.62 美元

  6. R Cookbook

  

深度学习

 

  这本指南提供了使用 R 语言快速进行数据分析的方法。它包含了 200 多个关于这一开源语言(统计学家们的首选)的方法。本书的书评员也是第一次接触 R,并将这本书描述为为他们节省了大量时间的具有实践意义的入门指南和参考工具。

  作者:Paul Teetor

  价格:Kindle 版 24.99 美元,纸质版 32.62 美元

  7. Storytell ing With Data

  

深度学习

 

  如果你不能用受众群体觉得有趣的方式呈现给大家,那从数据中发现的关键点还有意义吗?这种把信息放到语境当中的技能也是非常有价值的能力。这本书就在以下三点上提供了窍门:如何将受众的注意力引导到最重要的数据点,如何用恰当的可视化方法交流数据,如何用故事化的方法将信息传递给受众。

  作者:Cole Nussbaumer Knaflic

  价格:Kindle 版 20.79 美元,纸质版 22.44 美元

  8. Learning Spark

  

深度学习

 

  Hadoop 已然成为大数据的同义词了,然而 Spark 却是一个让大数据工程发展更快的新型的、热门技术。每一系列大数据书集都会包含一本关于 Spark 的书,而这一本则是由 Spark 的开发人员撰写的。这本书涵盖了分布式数据集、内存式缓存、交互式 shell 和像 Spark SQL 和 MLib 那样的嵌入式文库,以及连接像 HDFS、Hive、JSON 和 S3的数据资源。

  作者:Holden Karau,Andy Konwinski,Patrick Wendell 和 Matei Zaharia

  价格:Kindle 版 21.49 美元,纸质版 34.26 美元

  9. Weapons Of Math Destruction: How Big Data Increases Inequality And Threatens Democracy

  

深度学习

 

  这不是一本指导用书或入门书。相反,这本书关注的是:因为每个人都由同一套规则评判,算法能否通过将人类从计算中解放出来,从而让世界更加公平。但是作者也指出,对立方才是正确的。本书由前华尔街数量分析专家撰写,将带你了解算法性质的未来对文化和经济的影响。作者就我们现有的模式展开讨论,他认为这个模式是不透明的,未校准的,无可抗衡的。甚至他们是错。而且他坚持这些模式会增强歧视。举例来说,如果一个穷学生因为他的邮政编码信息显示他风险太高(还贷能力弱),那他就无法得到贷款(译者:国外银行卡会登记邮编,所以可以通过查询邮编来得知相应的信用记录),随后他将无法得到这个能将他带离贫困的教育机会。

  作者:Cathy O'Neil

  价格:Kindle 版 13.99 美元,精装版 18.50 美元

  10. Building Data Science Teams

  

深度学习

 

  这是一本由美国白宫国家科学与技术政策办公室的首席数据科学家撰写的免费电子书。本书阐释了技能、观点、工具和他认为成功定位数据科学团队的流程。作者 DJ Patil 将他作为 Linkedin 数据科学团队架构师的经历带到本书当中,描述了成为数据科学家的四个重要资质和建立「数据驱动(data driven)」组织意味着什么。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
描述方法:线性表/数组和矩阵/堆栈、队列、跳表和hash技术 数据结构:二叉树和一般树、优先队列:堆、左高树、竞赛树、搜索树、图 算法设计方法:贪心算法、分治算法、动态规划、回溯、分支限界等多种算法设计方法,为数据结构与算法的继续学习和研究奠定了一个坚实的基础。 本书是关于计算机科学与工程领域的基础性研究科目之一——数据结构与算法的专著。 本书在简要回顾了基本的C++程序设计概念的基础上,全面系统地介绍了队列、堆栈、树、图等基本数据结构,以及贪婪算法、分而治之算法、分枝定界算法等多种算法设计方法,为数据结构与算法的继续学习和研究奠定了一个坚实的基础。更为可贵的是,本书不仅仅介绍了理论知识,还提供了50多个应用实例及600多道练习题。 本书内容广博权威,结构清晰合理,是一本全新的有关数据结构与算法的教材,对广计算机科学与工程领域的从业人员也是一本很好的参考书。 本书特色: “纵览全书可以看出作者具有丰富的教材编写经验。它是一本新的、有关数据结构与算法的教材,适合于当前计算机本科教学的需要。” ——Sang W.Lee,密歇根大学 “注重应用不仅可以使课堂教学更生动,而且可以激励学生投身于相关的应用。” ——Yu Lo C.Chang,新汉普郡大学 本书不同于以往介绍数据结构或介绍算法的书,而是囊括了数据结构及算法,是作者在该领域做出的又一个创新性的贡献。本书的另一个独特之处在于其充分强调了应用性。对于每一种数据结构及算法,都分别采用了若干个来自不同领域的应用进行具体演示。 本书为学习和研究数据结构及算法奠定了坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值