《机器学习基石》笔记：第一讲

最新推荐文章于 2024-06-13 18:50:27 发布

肖橘猫

最新推荐文章于 2024-06-13 18:50:27 发布

阅读量409

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/sinat_30537123/article/details/78177282

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

林轩田老师的《机器学习基石》和《机器学习技法》两门课程非常经典，从哲学原理讲到算法核心，深入浅出，非常详细。但存在两个问题：
1.林老师是台湾（省）人，很多舶来品词语的翻译和大陆不同，加上林老师讲的比较快，一次听明白还是不容易的。
2.由于课程是视频形式，回头复习比较麻烦。因此，想把每节课的重要内容以笔记的形式记录下来，以供未来反复回头翻看。希望能坚持下来：）
下面开始正式内容。

1.课程介绍
本课程目的是“基石”导向的，力求学习者通晓原理又熟悉技巧，既不是枯燥的将理论，也不是速成式的讲算法（算法那么多，怎么学也学不完）。
2.什么是机器学习？
人类的学习过程是从大量经验中，通过观察学到技能。机器学习则是计算机（模型）从大量数据（data）中学到技能（skill）。
那么，什么是skill？skill就是在一个业务场景中提升某个指标，比如在股票投资中，模型通过大量data学习，使得投资者的股票回报率提高了，那么这就是学到了skill。
那么，为什么我们要使用机器学习（用其他的技术不行吗）？比如说要你在1000张图片中分辨哪些图片中包含树。此时，通过编写规则难以做到，我们无法（很难）将树的定义用数学抽象表达。因此，此类场景需要机器学习。
那么，使用机器学习的关键是什么？（1）存在潜在的模式（pattern）可供学习（2）人工编写规则难以做到（3）存在足量的该pattern生成的data。
机器学习的应用涵盖了我们的衣食住行教育娱乐等日常生活，典型应用有NLP、IR、RS等。
那么，一个机器学习应用包含哪些基本成分？（1）input:X（2）output:Y（3）f:X–>Y（f代表pattern，也就是我们未知但是想求出的一种对应法则）（4）training set:D（5）hypothesis set（假设空间），也就是g的全集。（5）g:X–Y（我们想求得f但是求之不得，所以通过data求一个近似于f的g来代替f）
这里写图片描述
3.机器学习的流程：

那么，机器学习和数据挖掘、人工智能、统计学等这些学科领域的关系是怎样的？
首先，机器学习是希望通过data来近似求得一个和f相似的g。
而数据挖掘则是通过data发掘有趣（interesting）的事情，数据挖掘包含的范围更大。
其次，机器学习是（目前看来）实现人工智能的一个最佳途径。
最后，机器学习里面使用的很多方法都是统计学家在很早以前发现的。统计学领域更注重用数学方法预测假设，不太重视大量的数据计算。

肖橘猫

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
《机器学习基石》笔记：第一讲

林轩田老师的《机器学习基石》和《机器学习技法》两门课程非常经典，从哲学原理讲到算法核心，深入浅出，非常详细。但存在两个问题： 1.林老师是台湾（省）人，很多舶来品词语的翻译和大陆不同，加上林老师讲的比较快，一次听明白还是不容易的。 2.由于课程是视频形式，回头复习比较麻烦。因此，想把每节课的重要内容以笔记的形式记录下来，以供未来反复回头翻看。希望能坚持下来：）下面开始正式内容。1.课程介绍
复制链接

扫一扫