2023 年最值得阅读的三本数据科学书籍

2023 年要读的四本令人惊叹的数据科学书籍(如果你在 2022 年不读的话)。

简介

2022对于全球机器学习社区来说,这真是令人惊叹的一年!许多期待已久的游戏已经或即将发布,包括历史经典的新版本。

在这篇文章中,我想与您分享我认为今年特别值得(不仅)阅读的三本 2022 年书籍。

你可以留言获得每本书相关的一系列链接,包括电子书硬拷贝免费拷贝代码存储库(如果有)。

1

概率机器学习:简介(2022 年版)

Kevin Murphy (2022) 的“概率机器学习:简介”的扉页和封面。图片由您真实提供。

一种由麻省理工学院出版社出版的Kevin P. Murphy真正经典的新版本。

全新版本包含 Python 代码(在随附的存储库中),涵盖了从基本概率到图神经网络的无数主题。而且……所有主题都是从概率的角度呈现的!这本书长达 750 多页(不包括附录和参考资料),包含丰富的数学解释、有用的图表和启发性练习。

我喜欢墨菲的写作风格,即使他讨论复杂的话题,我也觉得它清晰而吸引人。这本书可能具有挑战性,但它也相当独立。无论何时需要更多背景,作者都会为我们提供有用的参考资料。这本书附带了一个极其丰富的参考书目,将近 33 页。

本书的续集——“概率机器学习:高级主题”——将深入探讨贝叶斯推理、生成模型、因果关系和结构发现等主题。就个人而言——我迫不及待地想要得到它!

如果你想拓宽、深化或组织你的统计和机器学习知识,《概率机器学习:简介》是一本很棒的书。如果您需要对某些主题进行复习,或者您正在努力对您在日常工作中使用的概念进行更深入的数学理解,这是一个极好的资源。它也是一个非常丰富的参考资料和鼓舞人心的代码来源。

对如何集成概率建模神经网络感兴趣?查看Python中关于概率神经网络的系列文章:

使用 TensorFlow Probability 对神经网络中的不确定性进行建模

2

Python 中的贝叶斯建模和计算

Martin 等人的“Python 中的贝叶斯建模和计算”。(2022 年)。图片由您真实提供。

“Bayesian Modeling and Computation in Python ” 由Osvaldo A. Martin、Ravin Kumar和Junpeng Lao于 2022 年初由 CRC Press 出版。本书为您提供超过 380 页的精彩内容,包括丰富的附录和参考书目。

这是一个很好的资源,可以帮助您巩固有关贝叶斯推理和工作流程的知识。每章最后都附有实际例子和一套练习。这本书涵盖了贝叶斯推理、模型探索性分析、线性模型(包括分层和混合效应模型)、样条曲线、贝叶斯时间序列和回归树、端到端贝叶斯工作流程等基础知识。

建模的实际方面是本书的核心。丰富的视觉内容有助于建立对模型内部工作的直观理解,这在调试复杂架构的上下文中非常有用。

作者使用PyMC3 和TensorFlow Probability作为本书中的主要概率框架,并简要讨论了其他概率语言,如Stan和NumPyro。内容严重依赖ArviZ——一个用于对贝叶斯模型进行探索性分析的非凡 Python 库。该代码可在本书和随附的存储库中找到。

丰富的附录为我们提供了理论基础的坚实概述,但如果缺少某些内容,您可以随时参考 Kevin Murphy 的“概率机器学习:简介”。有趣的是,Kevin Murphy 为《Python 中的贝叶斯建模与计算》写了前言。两本书相得益彰,并行阅读是一种快乐的体验!

3

图形深度度学习

Yao Ma & Jiliang Tang (2020) 的“图上的深度学习”。图片由您真实提供。

W这本书由马尧和唐继良撰写,王一奇、金伟、马尧和唐继良的中文版由剑桥大学出版社于 2021 年 9 月出版,是一本在图上使用深度学习技术的综合指南。

这本书涵盖了从图形和深度学习基础到图形神经网络 (GNN) 的高级主题的所有内容。作者为所讨论的概念提供了可靠、清晰的数学和直观的解释。您会发现这里讨论的 GCN、GAT 或 GraphSAGE 等流行架构以及不太流行(但绝对不是不那么有趣)的主题,例如图上的变分自动编码器。

这本书整齐地分为四个主要部分:(1)基础,(2)方法,(3)应用和(4)进展。您可能认为阅读它的最佳方式是遵循此结构,但根据您的背景和目标,作者提出的线性建议较少。这些建议具有……图表的形式:

如何阅读马尧和唐继良的“图上的深度学习”(2020)。

这本书提供了 GNN 的坚实基础。如果您想更深入地研究给定的主题,每个部分的末尾都有一个非常有用的进一步阅读列表。

如果您想对您的 GNN 学习经验进行三角测量,可以查看或者联系我们获取Jure Leskovec的精彩系列讲座和关于 GNN 的精彩播放视频。

需要每本书的电子书硬拷贝免费拷贝代码存储库(如果有),可以关注我们私信获取。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
描述方法:线性表/数组和矩阵/堆栈、队列、跳表和hash技术 数据结构:二叉树和一般树、优先队列:堆、左高树、竞赛树、搜索树、图 算法设计方法:贪心算法、分治算法、动态规划、回溯、分支限界等多种算法设计方法,为数据结构与算法的继续学习和研究奠定了一个坚实的基础。 本书是关于计算机科学与工程领域的基础性研究科目之一——数据结构与算法的专著。 本书在简要回顾了基本的C++程序设计概念的基础上,全面系统地介绍了队列、堆栈、树、图等基本数据结构,以及贪婪算法、分而治之算法、分枝定界算法等多种算法设计方法,为数据结构与算法的继续学习和研究奠定了一个坚实的基础。更为可贵的是,本书不仅仅介绍了理论知识,还提供了50多个应用实例及600多道练习题。 本书内容广博权威,结构清晰合理,是一本全新的有关数据结构与算法的教材,对广计算机科学与工程领域的从业人员也是一本很好的参考书。 本书特色: “纵览全书可以看出作者具有丰富的教材编写经验。它是一本新的、有关数据结构与算法的教材,适合于当前计算机本科教学的需要。” ——Sang W.Lee,密歇根大学 “注重应用不仅可以使课堂教学更生动,而且可以激励学生投身于相关的应用。” ——Yu Lo C.Chang,新汉普郡大学 本书不同于以往介绍数据结构或介绍算法的书,而是囊括了数据结构及算法,是作者在该领域做出的又一个创新性的贡献。本书的另一个独特之处在于其充分强调了应用性。对于每一种数据结构及算法,都分别采用了若干个来自不同领域的应用进行具体演示。 本书为学习和研究数据结构及算法奠定了坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值