机器学习 第1章 绪论

引言

机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型" 的算法,即"学习算法"。 有了学习算法,我们把经验数据提供给它,它就能基于这些数据产生模型;在面对新的情况时(例如看到一个没剖开的西瓜),模型会给我们提供相应的判断(例如好瓜) .如果说计算机科学是研究关于"算法"的学问,那么类似的,可以说机器学习是研究关于"学习算法"的学问.

基本术语

数据集:一组记录的集合
示例/样本:数据集中的每条记录
属性:反映事物在某方面的性质
属性值:某个属性所取的值
属性空间:由属性张成的空间
学习/训练:从数据中学得模型的过程
训练数据:.训练过程中使用的数据
训练样本:训练数据中的样本
训练集:训练样本组成的集合

假设空间

假设空间是一个包含所有可能的解的集合,模型会在假设空间中进行搜索以找到最优的解。假设空间的大小和拓扑结构对于学习算法的性能有重要影响,通常是由问题的特性和算法的选择决定的。
在本书的例子当中,西瓜的数据集和假设空间分别如下:
在这里插入图片描述
在这里插入图片描述
在这里,我们对西瓜的色泽、根蒂和敲声这三个属性进行各种指的假设,所列举的假设结果即为其样本空间。可以有许多策略对这个假设空间进行搜索,例如自顶向下、从一般到特殊,或是自底向上、从特殊到一般,搜索过程中可以不断删除与正例不一致的假设、和(或)与反例→致的假设。最终将会获得与训练集一致(即对所有训练样本能够进行正确判断)的假设,这就是我们学得的结果。

归纳偏好

归纳偏好是指学习算法在假设空间中对某些解的偏好性,即更加倾向于某些假设而不是其他的假设。这是由于学习算法的局限性和对问题的理解不完全导致的。奥卡姆剃刀原则和NFL定理是与归纳偏好密切相关的概念。
如下图所示,图中虚线部分是由每一个训练样本(图中坐标点)组成的,我们的目标是要找到一条尽量接近实际函数图像的一条曲线,建立一个更为精确的模型以减少误差。
在这里插入图片描述

奥卡姆剃刀原则:
奥卡姆剃刀原则(Occam’s Razor)是一种偏好简单模型的原则,它认为在解释一个现象时,应该选择最简单的解释。简单模型更容易理解和泛化,并且能够更好地应用于新的数据上。因此,在设计学习算法和模型时,需要考虑模型的复杂性和简单性。

NFL定理:
NFL定理(No Free Lunch Theorem)是指在没有关于问题的任何先验知识的情况下,所有学习算法的性能在所有问题的分布上是均衡的。这意味着没有一种学习算法是万能的,在所有问题上都能表现优异。因此,设计适用于特定问题的学习算法需要深入理解问题的特性和特定的应用场景。

发展历程

机器学习源于人工智能领域,经过几十年的发展,如今已经成为人工智能的主要技术手段之一。随着大数据、深度学习、强化学习等技术的不断发展,机器学习在语音识别、图像处理、自然语言处理、智能推荐等领域有着广泛的应用。

应用现状

机器学习在社会中的应用现状非常广泛,包括医疗诊断、金融风控、智能交通、物流配送、工业制造等各个领域。例如,在医疗领域,机器学习可以帮助医生诊断疾病、预测病情发展、个性化治疗方案等。在金融领域,机器学习可以帮助银行进行信用评分、风险控制等。在智能交通领域,机器学习可以帮助智能交通系统进行交通管理、智能驾驶等。可以预见,机器学习在未来会有更广泛的应用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一只小小程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值