人工智能基础课【学习笔记】结课 | 溯洄从之，道阻且长

Eleven_Whats

于 2024-06-15 12:33:45 发布

阅读量1k

点赞数 29

文章标签：人工智能学习笔记

本文链接：https://blog.csdn.net/Eleven_Whats/article/details/139699987

版权

结课 | 溯洄从之，道阻且长

三个月的时间弹指即逝，40 期的《人工智能基础课》已走到尾声。在专栏里，我和你一起走马观花地浏览了人工智能的技术概观，以建立人工智能初步的知识体系。

算起来，经历了三起三落之后，人工智能已步入花甲之年。虽然在创造者眼中仍然是个孩子，但对你我这些后学之辈来说，这位老人身上还是有无穷的奥秘有待探索。在我看来，《人工智能基础课》应该是一份简历、一份提纲，勾勒出这个领域的基本框架。当然，简历无法浓缩一个人丰富的经历，40 篇文章的体量也不足以覆盖人工智能的全部内容。想要基于这份提纲深入研究，还需要大量的时间和精力的付出。

在互动中，不少朋友都表达了从事人工智能工作的意愿。实话实说，把这门技艺当成茶余饭后的谈资和养活自己的饭碗是截然不同的两码事情，所以需要深思熟虑之后再做选择。

如果你还没有走出校园，那就应该踏踏实实学好相关的基础课程和专业课程，仰望星空不如脚踏实地，一味好高骛远只会把理想变成毫无根基的空中楼阁。

如果你已经走入了工作岗位，那一定会知道不能盲目追逐热点的道理。所以在决定转行之前，务必要想清楚想做什么和能做什么，别让自己成为热点的牺牲品。

相比于转行，我认为更好的做法是将人工智能融入到现有的工作之中。人工智能的价值在于落地，它的优势则是几乎在所有领域都有用武之地。

与其星辰大海，不如近水楼台，将自身专门的领域知识和人工智能的方法结合，以处理和解决实际问题，并在实践中不断学习和进化，才是搭上人工智能这列快车的正确方法。

今天的互联网行业中可说是言必称 AI，不扯上点儿人工智能出门都不好意思和别人打招呼。在我看来，这或许并不是什么可喜可贺的现象。资本的热炒在客观上助长了人工智能的泡沫化趋势，也让各行各业的非技术人员产生不切实际的认知甚至幻想。如果有志于从事这个行业，一定不要被旁观者的狂欢所传染和迷惑，务必要保持当局者的冷静。

客观地说，人类智能和人工智能各有所长，互为补充。人类的优势在于想象力和创造力，机器则更擅长完成具有固定规则的重复性劳动。人类的科学精英们重建自身的宏愿，在大自然看来甚至不值一哂。一个连自己的出身都没搞清楚的孩子，就做起了造物主的春秋大梦。即使有朝一日真的具备了造物主的能力，我也想象不出一个具备思考能力的新物种的出现，对人类自身会有什么样的积极意义。

因此，在我个人看来，通用人工智能是非常有价值的科学问题，但现在就把大量资源投入其中未免不得要领。一口吃不成个胖子的道理对科学研究同样适用，逐步在应用中积累经验，再从经验中提取出理论，才是合理的路径。在从事人工智能的工作时，胡适先生的名言“多研究些问题，少谈些主义”可以说是再合适不过了。

把目光放长远些就不难发现，人工智能已经不是个单纯的科学问题，其背后蕴藏的是强烈的哲学内涵和社会意义。在如火如荼的发展势头下，人工智能完全可能左右文明的走向甚至人类自身的命运，但绝不会是以乐观的方式。

1931 年，阿尔多斯·赫胥黎发表了小说《美丽新世界》，讲述了由人类创造的技术如何反过来主宰人类自身的故事。而在近 80 年后的今天，小说中的美丽新世界从未离我们如此之近。

从昨天的大数据，到今天的人工智能，再到明天的区块链，技术变革的大潮正以不可阻挡之势汹涌来袭。在这奔腾不息的潮流中，没人能够超然世外，可即使做不成风口浪尖的弄潮儿，也要小心别被裹挟到潜伏的暗流之中无法自拔。

与君共勉。

第二期，聊聊机器学习

基础课是学习人工智能的入门第一课，相当于给了你一张人工智能的地图，我希望你可以按图索骥，一点点摸清楚人工智能的大概轮廓，找到学习的方向。

但是人工智能领域的内容浩如烟海，40 期的基础课也基本上是浅尝辄止，只能算是带着你品尝了一下味道。要想继续在人工智能领域深耕，就要沿着人工智能的学习路径，继续打好基础，而人工智能里最重要的基础一定是机器学习。

近年来深度学习很火热，特别是 CNN、RNN 等深度学习模型都取得了很好的效果，获得了极大的关注。但是深度学习的很多模型、算法其实都是根植于机器学习的。对机器学习没有深入学习和深刻理解的话，也很难真正掌握深度学习的精髓。毫无疑问，机器学习依然占据着人工智能的核心地位，也是人工智能中发展最快的分支之一。

在这个新专栏中，我会从机器学习中的共性问题讲起，从统计机器学习和概率图模型两个角度，详细解读一系列最流行的机器学习模型。除了理论之外，在每个模型的介绍中还会穿插一些基于 Python 语言的简单实例，帮你加强对于模型的理解。

“机器学习 40 讲”专栏共 40 期，分为 3 大模块。

机器学习概观。这一模块将从频率学派与贝叶斯学派这两个视角来看机器学习，并讨论超脱于模型和方法之外的一些共性问题，包括模型的分类方式、设计准则、评估指标等。

统计机器学习模型。这一模块将以线性模型为主线，讨论模型的多种扩展和修正，如正则化、线性降维、核方法、基函数变化、随机森林等，探究从简单线性回归到复杂深度网络的发展历程。

概率图模型。这一模块将以高斯分布为起点，将高斯分布应用到从简单到复杂的图模型中，由此认识不同的模型特性与不同的计算技巧，如朴素贝叶斯、高斯混合模型、马尔科夫随机场等。

专栏详细目录如下：

希望可以和你一起，在人工智能的道路上继续探索。

“人工智能基础课”之二三闲话为什么要做基础课这个专栏？

正如开篇词中所说，人工智能很可能成为下一个生存必备的技能。不管以后是不是吃这碗饭，对人工智能原理和方法的理解都不可或缺，这是技术进步倒逼出来的结果。深一步讲，先贤孟子“劳心者治人，劳力者治于人”的名句一针见血、言犹在耳。两千多年后的今天，虽然劳心和劳力的方式都发生了翻天覆地的变化，可治与受治的关系依然不动如山。更可怕的是，不进则退的劳力者甚至没有资格受治于人，而不得不受治于算法。《未来简史》中对这个问题的论述，有些是难得的理性思考，你可以读一读。

在这个日新月异的时代，懂点儿人工智能的知识绝对有必要，极客邦的技术人们能够敏锐地捕捉到这个趋势，其前瞻性值得佩服。可是，当编辑和我商谈开设一个关于人工智能基础知识的专栏时，我的第一感觉是费力不讨好。为什么呢？因为理工类学科的基础知识普及和品三国或者解读红楼梦完全是两码事。人文学科的核心价值在于观点和见解，这是对主观意识进行加工的产物；而理工学科的核心价值在于事实和规律，这是客观世界的存在方式。这个核心区别决定了讲文学可以天马行空，可讲科学必须脚踏实地。要将脚踏实地的东西天马行空地呈现出来，绝对是个棘手的问题。

正因如此，我们的专栏定位在技术的设计思想与实现原理。根据我自己学习和教学的经验，要在有限的时间里完成新知识的入门，首要问题是理解它为什么有用，其次才是掌握它如何起作用。在每篇专栏的文章中，我都力图通过通俗的语言解释清楚方法背后的意义：每种方法都有其诞生背景和适用场景，理解这些才有助于认识方法的核心价值。如果不管青红皂白摆出长篇大论的数学公式，文章的半数字符都是拉丁字母和希腊字母，这不仅对阅读者是种折磨，也和“基础课”的宗旨背道而驰。

但想必你也有这样的经验：解释复杂问题时，高度抽象的公式的表达能力远远胜过啰哩啰嗦的语言。所以如何能像宣传语所说的通俗易懂地把算法解释清楚，其伤脑筋的程度大大超出了我的预期。对困难的估计不足使写作时每每因为找不到合适的实例抓耳挠腮已经成为常态，可一旦找到一个形神兼备的类比，那大呼过瘾的兴奋又溢于言表。对我自己而言，这又何尝不是学习与进步的过程呢？

在专栏里我们会讨论哪些内容？

在具体内容的设置上，我认为专栏作为一个相对长期而稳定的输出过程，结构化和系统性是应该满足的基本要求，而人工智能基础课这个主题恰恰具有内容编排上先天的优势。出于这样的考虑，专栏的内容以当下主流的连接主义学派为主，覆盖了数学基础、机器学习、人工神经网络、深度学习、应用场景等内容，力求给出对人工智能发展现状完整的概括。

这个专栏能给予你对人工智能概貌性的理解，但它只是块敲门砖，而不是打开人工智能神秘宫殿的万能钥匙。想要深入理解人工智能，你还需要大量时间、精力、甚至金钱的付出。毕竟，劳心者也不是那么好当的。

此外，专栏的目标场景是茶余饭后的碎片化时间，因而采用的是音频为主、文字为辅的形式。在有限的容量中，我的优先选择一定是将每个话题的核心内容呈现给你。而有舍才有得意味着在突出主题的指导思想下，辅助性和支撑性内容就必然有所缩减，被舍弃的辅助支撑内容就是数学推导以及代码实现。当然，这部分内容的淡化也出于操作性上的考虑，因为公式和代码既不适合以音频的方式表达，也不适合在移动终端上处理。

但对数学推导和代码实现的淡化并不意味着这两部分内容无足轻重。如果有志于从事人工智能理论方面的研究，那么理论问题就是必须征服的大山。我建议你在通过专栏理解了每种方法背后的思想与思路后，再结合推荐的参考书目以及二级参考书目去深入数学细节。当然，阅读最新的论文也是跟进最新研究进展的有效方法。大部分顶级会议论文都可以在会议网站或预印本网站 arxiv.org 上免费获取，可以根据自己的需要有选择地阅读。

纸上得来终觉浅，绝知此事要躬行

如果要在人工智能的工程岗位上大显身手，就要让知识转化成能力。其实要实现这个转化，最好的办法就是参与到实战项目中。无论是科研项目还是工程项目都能让你在实践中成长，这个“不想学也得学”的过程虽然痛苦，却有涅槃的奇效。如果没有参加项目的条件，一个退而求其次的选择是做一做网络公开课的大作业。包括辛顿和吴恩达这些大咖都在各种平台上开设有人工智能的公开课程，完成其中的项目也是很好的实践方式。

虽然网络上的资源非常丰富，大量优质的代码唾手可得，但我还是建议你亲自动手编一编写一写。毕竟终日而思不如须臾之所学，即使是 Hello World 在实际编写时都可能出现这样那样的问题，远非想象中那么简单。在这里也给你推荐一本 Peter Harrington 所著的 Machine Learning in Action，中译本名为《机器学习实战》。本书是基于 Python 语言，面向应用的算法书，包含大量现实案例，可以作为代码学习的参考。

我们该如何对待人工智能？

最后要说的是，对待人工智能，我们既不能轻视它，也不该神化它。只要掌握人工智能的原理与方法，就永远轮不到它来主宰你的命运。所以我们务必以平常心来看待人工智能，不要被媒体的聒噪所忽悠。对人工智能的态度应该是对知识本身的尊重，而不是对虚无缥缈的超智能的莫名惶恐。回头想想，你在学习高等数学或者 C 语言的时候会有它们会毁灭世界的担忧吗？人工智能和高数、C 语言又有什么本质区别呢？

在此，我要衷心感谢你的厚爱与反馈，它们既为我指明了改进的方向，也是督促我奉献更好内容的不竭动力。当然，受个人水平所限，专栏中肯定存在着各种各样的不足，恳请你继续提出宝贵建议，让你我一起进步、成长。

与君共勉！

关于一位优秀者的学习方法

我觉得学习方法是很重要的，很多东西学不好大多不是智商问题，更可能是没有学习热情，或者学习方法不对。通过这几年的学习，我总结出不少我认为很有效的学习方法，同时也学习了很多别人先进的学习方法。在这方面我从万维钢老师的专栏中学到不少。

近年来一万小时刻意练习理论很火。万维钢老师说过数学是特别适合刻意练习的，我很想试验一下 1 万小时下来，我能不能真的从无基础开始成为人工智能方面的专家。这里刻意练习很重要，虽然现在社会上终身学习的风气很旺，但是大多数人的学习是娱乐性的，这不能叫做刻意练习。比如我一开始通过看可汗学院视频学数学，虽然可汗的数学视频非常好，但是我觉得看可汗学院并不是很好的学数学的办法。因为一来可汗学院教的数学内容偏简单，像微积分，线性代数等章节，可汗只讲了很基础的内容。二来可汗学院习题不够。我一开始通过可汗学院学数学，当时看视频觉得都懂了，结果一个月后回顾时发现所有知识点全都忘光了。这主要原因就是缺乏练习。学数学一定要多做习题，把一种算法练到成为条件反射才算是掌握了这个算法，我觉得这才是刻意练习的精髓。
我觉得上麻省理工学院的 MIT OPEN COUSERWARE 网站学数学很有效，这个网站上面有麻省理工的很多课程的教学视频，老师讲课质量都非常高，比国内的高数教学视频要好。除此之外，对于不少课程，这个网站上面还有教科书推荐，课后习题和答案，甚至还有期末考试试卷和答案。我觉得除了看他们的视频之外，按照他上面的推荐买一些英文原版的教科书来学。每个章节结束后自觉做习题很重要。最重要的是学完一门课自己应该做几份这门课的期末试题，我对自己的标准是自己做卷子能达到 80% 以上的才能算过关，否则应该重新学一遍。
我把全年的学习分成 50 个小计划，这样每完成一个计划有一定的成就感。同时每 100 小时作为一个学习区块，不同的知识内容按照不同的难度分配不同的学习时间区块。这样做一来可以逼迫自己在一些知识上花费足够的时间，二来可以避免有些知识上花费过度的时间精力。因为每个人时间都是有限的，假如你一年自学有 1000 小时可供利用，你不希望在某个细节上花费掉三四百小时，导致其他知识没时间学。要设定一个难度合理的计划其实也不容易，去年我的计划就远远没完成，今年过了 6 周时间，我也只完成了 3 周的计划，希望能尽快补上。
时间管理方面，其实很多闲暇时间都可以被利用上。我现在大体能做到把一天之内闲暇时间都利用上了。走路，上厕所，洗澡时可以听音频节目，通勤时可以阅读一些学习内容。我觉得自己开车是很浪费时间的事情，坐公共交通的话就可以把通勤时间利用上了。其实光是坐电梯时都能挤出不少时间。我算过，平均每天坐电梯，等电梯的时间都要十几分钟左右。这段时间其实拿来背单词很不错，15 分钟可以背 50 个单词左右。其实每天要真挤时间，可以挤出很多时间来学习，一般人也就每天睡 7 个半小时，工作 8 小时，每天剩下 8.5 小时除去一些杂事和适当娱乐，理论上也能拿出 3 到 4 小时出来。周末在家可以花更多时间学习。当然有时候压力太大也会偷懒，比如我去年下半年玩某款游戏上瘾，试过连续两三晚一直在玩游戏的。自己尽量克服就好。我这两年一共学习了 2039 小时，我计划是每年学习 1500 小时，这样 7 年就可以完成 1 万小时学习。目前实际上还没有完成计划。
我个人经验是学习时最好设定 1 小时闹钟，学习一个小时，休息 3 分钟比较好。学习期间尽量手机调飞行模式，不要听音乐避免干扰。这样能最大化学习效率。我的心态是：只有 1 万个小时，浪费 1 小时就少一小时，这样能珍惜时间。
根据艾宾浩斯记忆法，我每半年会花 100 小时左右复习一下之前学习的东西。
我在极客时间订阅了王天一教授的《人工智能基础课》和朱赟的《技术管理课》，同时在得到和喜马拉雅上也订阅了一些节目。其实这些节目作为平时调剂，休闲娱乐的内容还是挺不错的。