我与AI:我的“机器学习”过程

  1. 机器学习简介

如果说要论机器学习的历史,最早可以追溯到18世纪关于最小二乘法和马尔可夫链的推导,这些构成了机器学习的基础。上世纪50年代,艾伦·图灵关于“图灵机”的设想以及冯·诺伊曼的计算机体系结构的设计让机器学习这个概念逐渐变为了现实。从上世纪50年代末F·Rosenblatt的“Perceptron”模型一直到现在的各类神经网络模型,各种各样机器学习的算法模型的大量出现还是科幻小说中对于智慧AI的大胆设想都证实了机器学习对于人类生活生产的重要价值。可以说,机器学习这项技术对于现在的人类社会是不可或缺的。
在这里插入图片描述

机器学习对于制造业或互联网相关工作也十分必要,大量计算机方面的工作都需要了解Python或者机器学习相关的技术。互联网+、机器学习和制造业的相关结合也是中国目前发展的重要方向。可以说,机器学习也是互联网方面工作中不可或缺的重要知识基础和未来发展方向。
在这里插入图片描述

对于计算机、金融、数据分析、自动化等各种与计算机相结合的专业的同学来说,机器学习同样也不可或缺。无论是以后发表相关论文还是各类互联网+项目,机器学习可以说是非常重要的。任何相关专业和机器学习的有效结合可以大幅提高论文和项目的含金量,了解或学习机器学习相关知识,如果在未来的论文或项目中涉及到机器学习的相关内容和创新也不会感到发怵,反而能够得心应手,大幅提高论文和项目的质量。

  1. 我与“机器学习”的不解之缘

2.1 缘何相识“机器学习”

我是一位科班毕业的计算机学生,即将攻读计算机方向研究生,但是惭愧地说,我在本科阶段并没有学习机器学习相关的课程,对机器学习完全没有任何概念,一直到了大四我保研后,研究生导师突然让我开始做机器学习相关的毕业设计时我才发现我对机器学习完全没有任何了解。我上过类似吴恩达的机器学习相关课程,也读过周志华的机器学习“西瓜书”,但是里面大量繁杂冗余的公式都让我望而却步。只能观其表面,不理解其内在含义,这会在以后的学习和工作中非常吃亏。
在这里插入图片描述

为了去理解这些公式带来的含义,提升自己的机器学习基础能力,我去找了很多相关的教材和视频,尝试去理解这些公式,但是完全靠自己去理解还是过于困难,没有一个好的老师辅助去教授这些知识,我还是不能理解这些复杂公式带来的含义。印象最深刻的就是学习SVM的核函数的时候,只学过微积分、概率论和线性代数的我当听到特征希尔伯特空间的时候整个人都是懵的,很多公式的数学符号我也完全看不懂,但是在书中学习这些基础的时候又不可避免地要学习这些公式。

为了解决机器学习老大难的问题,我决定还是去网络上搜索一些机器学习相关的完备课程来辅助我学习,而不是搜索单一的视频或者书籍。这样也是为了未来的研究生学习打下良好基础。就这样,我发现了一个课程:贪心AI“机器学习基础”课程。

2.2 “贪心AI”为何甚好

课程设计

贪心AI的机器学习基础课程分为了共计17章节,从最简单的机器学习基础知识、线性回归模型,到后来的SVM,神经网络,全都有非常详细的课程设计,比如对于SVM来说,就包含了包括对Support Vector的直观理解,线性可分的支持向量机这类早期的SVM模型以及到后来的核函数的理解,特征希尔伯特空间的理解,从线性支持到非线性支持等。难度在一章中也是逐渐上升的,模型的复杂度也是从浅入深。而且在每章视频课程之后,课程还会让我开发一个基础的机器学习算法,将课上讲解的知识和公式用代码表示出来。不仅是因为代码表示的话就可以保证我们完全理解这个模型的公式(如果不理解的话自然也就无法写出代码了),可以说是知识和实践相结合了。
在这里插入图片描述

我在自己学习机器学习的时候从来没想过自己手写一个机器学习的算法,都是利用的各类框架,例如Tensorflow、Pytorch、sklearn等。这样虽然学习非常快,但是也只是触及机器学习的皮毛,不能理解机器学习的内在含义,在未来面对各种各样的机器学习模型,尤其是这些框架所不涉及的模型时,或者以后要查看每篇机器学习的论文的代码时,我也就无从下手了,只得现学现卖。但是贪心AI的课程就和我自学完全不一样,贪心AI的课程深度和广度兼具,而且难度设置也非常合理。我从最开始的机器学习介绍开始学习,先将机器学习的概念进行一些梳理,然后立即开始动手开发一个AI程序,还通过身高预测体重这样简单的案例入手机器学习,非常生动形象。第一次写完这个程序的时候我个人觉得整个程序其实非常简单,最初级的机器学习也没什么难的,也没有特别的“高大上”,毕竟机器学习真正的含金量体现在模型和算法上,至于代码无非也就是这些的实现而已。后面的章节难度逐渐提升,从我高中时代就学过的线性回归方程开始学习,然后逐步提升到比如贝叶斯算法(这也正是我研究生的研究方向之一)、随机森林(重要,现在传统机器学习算法中随机森林都表现出极好的特性),再之后就到了深度神经网络、SVM这样更加困难的算法。但是我觉得完全不用担心难度的问题,因为每章都会配合练习题或者案例对每个章节介绍的机器学习模型进行一个巩固、夯实、提高的过程,这样做能够让我更加牢固地理解每章教授的机器学习模型的概念、意义和使用场景。模型学习多了,在掌握了机器学习的基础概念之后,再多的模型也就能像学习各种各样五花八门计算机语言一样却不用担心学不会一样,只要能够抓住核心概念,就算模型难度在升高,学习成本也在逐渐降低。毕竟在通过贪心AI课程学习的过程中,有关机器学习概念和基础是越来越牢固的。

课程内容

之前我在自学机器学习的时候,无论是书籍还是各类视频资料等,老师在讲解机器学习模型算法的时候我总是觉得讲解的不够仔细。老师在讲解的时候,有时候前后逻辑不对或者老师跳过了一些他认为学生理所应当理解的一些知识时,我就不能理解模型算法公式代表的意义了(比如前面SVM中的特征希尔伯特空间,很多书中并未详细描述意义),但是因为是视频资料或者书籍资料,我不理解的时候又不能立即进行反馈,这样我就只能选择跳过不理解的部分。跳过的部分多了起来,我就只能理解皮毛不知其深浅了。但是贪心AI的课程却不一样。不仅老师在讲解的时候非常细致,讲解每章内容的时候每一个点都讲的非常丰富,而且全程还有专业助教来解答学生的各类问题,比如我学习的线性回归章节,虽然内容确实在整个课程中算是很简单的了,而且线性回归本身也是高中就学习过的数学知识,但是我同样存在一些没有理解的问题,尤其是针对多元线性回归方面我不是很理解(高中学习的不是很深入),我就立即去询问助教,这样就算我真的不理解老师这堂课介绍的模型的部分细节,我也能够立即通过助教去了解,这样就可以强化我所学的知识。而且每次课程结束都会有大量习题进行练习,做题的时候如果做对了自然是成就感爆棚,但是就算做错了,我在做题的同时也可以纠正并强化这节课所学的知识。这样的话,我也算做到了理解机器学习各类模型算法的意义,而不是像自学的时候学完一个模型也就草草了事,没有深入去理解模型的算法和适用意义。

课程师资

我自学机器学习的时候,因为都是从网络上搜索视频书籍资料,就完全不能保证师资力量,各种各样的人都有,有些教的不错,有些人甚至他们自己都略懂皮毛。最离谱的是我还遇到过明明是两个教同一个模型的视频资料,但这两个资料对这个模型的理解都完全不一样的情况。但是贪心AI的师资力量却非常优秀,而且做到了统一。比如说李文哲老师,李文哲老师是贪心AI的创始人,也是贪心AI的老师之一。他本人的学术水平自然是非常之高,有多篇顶会论文发表,包括AAAI、KDD等,均可以在dblp等数据库上查到。李老师讲解的非常细致,也非常全面丰富,甚至还会举一反三地进行讲解,明明课后已经有大量的练习题供我们进行练习了,但是李老师在上课的时候也能做到生动有趣,而不是像我大学时候的很多老师一样照着PPT念知识点,照本宣科,让我觉得非常痛苦,还不如自学。所以我大学时代常常翘课去工作室学习,还常常被老师点名(不要学我)。印象很深的是李老师在教机器学习的基础概念的时候,用了很多类比的方法来讲解AUC和ROC,我很容易就理解了这俩是什么意思,以及为什么要用这两个系数来评价模型优劣性,而我自学的时候也就只能拿着这俩参数直接去用,用sklearn框架直接套用在我的模型代码里面,没有理解这俩表示了什么意义,而不理解这两个参数的意义我就没法去针对性地优化我的机器学习模型。李老师可以说是我理想中的老师了。

在这里插入图片描述

课程配套设施

同时我还注意到,以前我在自学的时候,如果遇到了一个比较有趣的模型,我想去实际地尝试去搭建这样的一个模型,我就必须得自己在自己的电脑上去搭建环境。搭建过环境的应该都知道这是一个非常痛苦的过程,不仅python的库要下载(就算使用清华的镜像源还是会经常卡断重下),各个版本要匹配(CUDA和各种各样的Toolkit要和Tensorflow版本对应,对应不了还难以删除重下),还要查看自己的显卡和内存是不是能够运行部分机器学习的模型,对于一些甚至连显卡都没有,只能用CPU来运行机器学习模型的同学来说就非常痛苦了。但是我们在学习贪心AI课程的时候,课后的实践项目等等都有完整的在线环境可以让我们去使用,完全不用考虑内存、显卡等等配置的问题,更不用考虑还需要重新下载python库的问题,节省了自己电脑的空间,更节省了自己花费在搭建环境上的时间。上文提到的助教甚至也可以帮我查看修改我的代码中的bug,成功修改过后也能强化我对模型算法的代码记忆和对这个算法的理解。

总结

贪心AI的机器学习基础课程让我重新认识了机器学习这个日后必备的科学技术。无论是贪心AI的课程设计、课程内容的深度和广度、课程所配备的各项设施(练习题、助教、Playground等)、还有课程的师资力量,都是非常优秀的,我觉得在学习贪心科技课程的同时,也可以搭配一些教材,比如周志华西瓜书或者吴恩达的各类机器学习相关课程等,这样的话就可以双管齐下,在结合老师教授的内容的同时也可以再辅助看看书籍,这样也可以更加深入地了解机器学习,为未来学习和工作打下更坚实的基础。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Finance数据科学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值