Python机器学习中的数学原理详解（补充勘误表）

最新推荐文章于 2025-03-09 22:59:49 发布

白马负金羁

最新推荐文章于 2025-03-09 22:59:49 发布

阅读量1.4w

点赞数 16

分类专栏：图书出版及相关资源文章标签：数学机器学习机器学习中的数学数学修炼 python

本文链接：https://blog.csdn.net/baimafujinji/article/details/50237081

版权

图书出版及相关资源专栏收录该内容

27 篇文章

订阅专栏

数学是机器学习和数据科学的基础，任何期望涉足相关领域并切实领悟具体技术与方法的人都无法绕过数学这一关。在一篇题为《放弃幻想，搞AI必须过数学关》的网文中，作者一针见血地指出想从事AI相关工作的人必须先搞好数学，并给出了三点理由：

首先，数学不过关的人在 AI 这个圈子里是无法参与交流的，或者说得直白一点，是被人瞧不起的，根本无法被接纳成为AI 圈子里的人。
其次，数学不过关而只能调参数的人，实践当中并不好用。我接触过几个 AI 创业企业，他们都疯狂的缺人，但是对于不懂数学只会使用工具的“人才”，他们却大门紧闭。什么原因？沟通效率低，出活慢，遇到问题无法解决，一句话，“不好用”。
第三，即便是调参这件事情本身，懂不懂数学也是有很大差别的。如果你数学不过关，对参数的意义和相关关系理解不深，方向感不强，只能半随机的去刷参数，那么工作的单调性和烦琐性还会大大上升，很难坚持到做出好的模型来。

更进一步，我还想指出“矫枉过正”和“只求易懂、不求甚解”两个极端或者误区：

“矫枉过正”：简单说来，就是尽管数学很重要，但是不要跑题了，应该围绕机器学习来搞数学，而不是直接用研究数学来取代机器学习（那就本末倒置了）。机器学习学者张志华教授曾经说过：“搞好机器学习，关键是数学，但你又不能把机器学习变成搞数学，那样就漫无边际了。”数学浩瀚如海，神灵通天，我们还是要敬畏数学之神，不要毫无目标、不计成本的扩大数学的钻研，而是要把握好度。对于绝大多数 AI 工程师来说，还是应该以机器学习为主导，对于其中涉及的数学知识形成理解，打牢基础，突出重点，适度拓宽，这就算过关了。以后根据主攻方向，随用随学，急用先学，这样就可以了。
“只求易懂、不求甚解”：这是另外一个极端。既然不能喧宾夺主，本末倒置，那我是不是就可以只蜻蜓点水地稍微了解一下，而不求甚解呢？事实上，很多文章或讲解中所谓的通俗易懂、戏说大话，少些公式，多些比喻等等，就是一味地迎合一些人想抄近路的惰性心理，本质上只不过是用小学程度的数学来麻醉你。儿歌三百首当然通俗易懂了，但问题是看了那个你的机器学习功力就能突飞猛进吗？如果把凸优化、拉格朗日乘数法、吉布斯采样、反向传播算法这些稍微上点难度的数学全部剔除，或只讲概念，不讲推导，这样的机器学习数学真的有用吗？有些东西你很难绕开，特别是跟机器学习息息相关的数学。你理解的程度，决定了你的眼界，决定了你在实践中解决问题的功力。

基于上述思考和指导思想，我编写了《机器学习中的数学修炼》一书（清华大学出版社）。本书自出版以来，多次加印，JD.com上累计有超过1000条购买评论（好评度99%）。日前，本书的姊妹版《Python机器学习中的数学修炼》也已正式出版发行（原版同步热销）。本书完全以机器学习为主导，系统地整理并介绍了机器学习中所涉及的必备数学基础，这些都是笔者从浩如烟海的数学知识中精心萃取的，在学习和研究机器学习技术时所必须的内容。具体包括微积分（主要是与最优化内容相关的部分）、概率论与数理统计、数值计算、信息论、凸优化、泛函分析基础与变分法，以及蒙特卡洛采样等话题。为了帮助读者加深理解并强化所学，本书还从上述数学基础出发进一步介绍了回归、分类、聚类、流形学习、集成学习，以及概率图模型等机器学习领域中的重要话题。其间，本书将引领读者循序渐进地拆解各路算法的核心设计思想及彼此间的关联关系，并结合具体例子演示基于Python进行实际问题求解的步骤与方法。真正做到理论与实践并重，让读者知其然更知其所以然。