人工智能学习——第一章机器学习基础——1-1 机器学习：绪论

最新推荐文章于 2024-05-29 10:09:36 发布

bia布~

最新推荐文章于 2024-05-29 10:09:36 发布

阅读量50

点赞数

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57127999/article/details/130940549

版权

第1关：机器学习的主要任务

学习目标

根据本节课所学知识完成本关所设置的选择题。

相关知识

为了完成本关任务，你需要掌握：

机器学习主要任务，
分类，
回归，
聚类。

机器学习主要任务

分类是机器学习的一项主要任务，主要是将实例数据划分到合适的分类中。

机器学习的另外一项任务是回归，主要是预测数值型的数据，比如通过数据值拟合曲线等。

分类和回归属于监督学习，这类算法必须知道预测什么，即目标变量的分类信息。与监督学习相对应的是无监督学习，此时数据没有类别信息，也不会给定目标值。在无监督学习中，将数据集合分成由类似的对象组成的多个类的过程称为“聚类”。

接下来，我们来看看，什么是分类、回归与聚类。

分类

这是一系列关于西瓜的数据，这里的每个实体，或者每一行被称为一个样本或数据点，而每一列（用来描述这些实体的属性）则被称为特征。假如说，我们现在想通过色泽、根蒂、敲声这几个特征来区分一个西瓜是好瓜与不是好瓜，这就是一个分类问题。分类问题的目标是预测类别标签。在这个例子中，“是”与“否”则是预测类别的两个不同的标签。分类问题有时可分为二分类和多分类，西瓜的例子则是一个二分类问题，多分类指的是数据不止两个类别，它有多个类别。

回归

回归任务的目标是预测一个连续值，编程术语叫作浮点数。假如说我们现在手里得到的是如下数据：

我们要通过色泽、根蒂、敲声来预测西瓜的价格，这就是一个回归问题。区分分类任务和回归任务有一个简单方法，就是看输出是否具有某种连续性。如果在可能的结果之间具有连续性，那么它就是一个回归问题，比如说价格。

聚类

聚类属于无监督学习，它是指我们的数据只有输入，没有输出，并需要从这些数据中提取知识。聚类算法将数据划分成不同的组，每组包含相似的样本。比如说：

我们现在手里的数据只有色泽、根蒂、敲声这几个特征，我们通过这三个特征，把性状相似的西瓜分到一个组，这就是一个聚类问题。聚类问题与分类问题的本质区别就是有没有标签。

测试说明

根据本关所学习到的知识，完成所有选择题。

第2关：机器学习的常见术语

学习目标

根据本节课所学知识完成本关所设置的选择题。

相关知识

为了完成本关任务，你需要掌握：

机器学习常见术语；
假设空间；
归纳偏好。

机器学习常见术语

我们已经知道了，机器学习是利用数据，从数据中归纳出规律，并用来对新事物进行预测。所以，机器学习首先要有数据，假设我们收集了一份关于西瓜的数据：

我们把数据中的每一行称为一个示例或样本；
反映事件或对象在某方面的表现或性质的事项，如：色泽、根蒂、敲声，称为属性或特征；
属性上的取值，例如：青绿、乌黑。称为属性值或特征值；
我们把一个示例（样本）称为一个特征向量。

一般地，令 D={x_1,x_2,..,x_mx1,x2,..,xm} 表示包含 m 个示例的数据集，每个示例由 d 个属性描述（例如上面的西瓜数据使用了三个属性），则每个示例：

x_i=(x_{i1};x_{i2}; ...;x_{id})

是 d 维样本空间X中的一个向量，x_ixi∈X，其中x{_ij}xij是x_ixi在第 j 个属性上的取值。d 称为样本x_ixi的维数。

从数据中学得模型的过程称为“学习”或“训练”，这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为“训练数据”，其中每个样本称为一个“训练样本”，训练样本组成的集合称为“训练集”，学习过程就是为了找出或逼近真相。

假设空间

假设空间在已知属性和属性可能取值的情况下，对所有可能满足目标的情况的一种毫无遗漏的假设集合。

接下来举个例子来说明什么是假设空间。在选择配偶时我们可能有以下几个指标：

体型 : 肥胖，匀称，过瘦；
财富 : 富有，一般，贫穷；
性子 : 急，不急不慢，慢。

现在我们要构建一个合适的假设空间来构建一个择偶观：

对于体型来说有肥胖、均匀和过瘦 3 种，也有可能价值观里认为这个无关紧要，所以有4种可能。

对于财富来说有富有、一般以及贫穷 3 种可能，也有可能价值观里认为这个无关紧要，所以有4种可能。

对于性子来说有急、不急不慢以及慢 3 种可能，也有可能价值观里认为这个无关紧要，所以有4种可能。

最后再加上一个极端的情况，也就是体型、财富以及性子这 3 个评判准则选出来的都不是想要的配偶。

所以假设空间的规模大小为4*4*4+1=65。

归纳偏好

归纳偏好是机器学习算法在学习过程中对某种类型假设的偏好。说白了就是“什么样的模型更好”这一问题。

以韦小宝的 7 个老婆为例，这 7 个老婆均满足小宝的要求，因此构成了大小为 7 的假设空间。(实际上，假设空间的大小一定是无穷大的。为了说明问题，我们暂时以 7 为大小)。那么，如何衡量哪一个假设空间中哪一个假设函数（老婆）最好呢？如果以温柔体贴为偏好来选，当然是小双；如果以小宝的迷恋为偏好来讲，假设函数就是阿珂。说白了，归纳偏好就是一个用于挑选假设函数的基准。

因此归纳偏好可看作学习算法自身在一个可能很庞大的假设空间中对假设进行选择的启发式或“价值观”。

而在具体的现实问题中，学习算法本身所做的假设是否成立，也即算法的归纳偏好是否与问题本身匹配，大多数时候直接决定了算法能否取得好的性能。

测试说明

根据本关所学习到的知识，完成所有选择题。

第3关：什么是机器学习

学习目标

根据本节课所学知识完成本关所设置的选择题。

相关知识

为了完成本关任务，你需要掌握：

什么是机器学习。

什么是机器学习

相信大家一定都非常喜欢吃西瓜，有经验的同学都知道如果一个西瓜色泽青绿、根蒂蜷缩、敲声浊响，那么就能判断这是一个正熟的好瓜。那么，为什么通过色泽、根蒂、敲声，这几个特征就能帮我们做出相当好的判断呢？因为我们吃过，看过很多好瓜，累积了这方面很多的经验，而通过对经验的利用，就能对新的情况做出有效的决策。

上面对经验的利用是靠我们人类自身来完成的，计算机能帮忙吗？

机器学习正是这么一门学科，它致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。在计算机系统中，“经验”通常以“数据”的形式存在，因此，机器学习所研究的主要内容，是关于在计算机上从数据中产生的“模型”的算法，即“学习算法”。有了学习算法，我们就把经验数据提供给它，它就能基于这些数据产生模型，在面对新的情况时，模型会给我们提供相应的判断。

测试说明

根据本关所学习到的知识，完成所有选择题。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
人工智能学习——第一章机器学习基础——1-1 机器学习：绪论

第一章机器学习基础——1-1 机器学习：绪论通关答案
复制链接

扫一扫

bia布~ CSDN认证博客专家 CSDN认证企业博客

码龄3年

17: 原创

141万+: 周排名

18万+: 总排名

7195: 访问

: 等级

177: 积分

1: 粉丝

3: 获赞

12: 评论

19: 收藏

私信

关注

热门文章

分类专栏

大数据 1篇

最新评论

visual studio code配置环境命令（部分python库）
CSDN-Ada助手: 恭喜你写了这么有用的一篇博客！能够分享给大家Visual Studio Code配置环境命令的部分Python库真的很棒。不过我觉得如果你能够再分享一些实际应用中遇到的问题以及解决方法，会让你的博客更加丰富和有深度。希望你能继续保持创作，期待你更多的精彩内容！
大数据学习——安装Hadoop所需环境搭建
m0_62848497: 为什么输入 cat ./id_rsa.pub >> ./authorized_keys 之后就提示没有这个文件
取模和取余的区别
CSDN-Ada助手: 恭喜您写下了第7篇博客！阅读了您的文章《取模和取余的区别》，我对这个主题有了更深入的了解。您在文章中清晰地解释了取模和取余的概念，并且指出了它们在计算中的应用场景。我很感谢您对这个话题的深入剖析。在下一步的创作中，我建议您可以探讨一下取模和取余在不同编程语言中的实现方式和差异。这样的比较能够帮助读者更好地理解和应用这两个运算符。同时，如果您能够分享一些实际的案例或者问题，让读者通过练习来加深对取模和取余的理解，那将会更加有趣和实用。再次恭喜您的创作！期待您下一篇博客的问世！保持谦虚和坚持创作的精神，我相信您会取得更大的进步！
java.util.Date与 java.sql.Date两个包该如何选择
CSDN-Ada助手: 恭喜您写了第8篇博客！标题很吸引人，也很有实用价值。对于java开发者来说，确实会经常遇到需要使用日期的情况，而java.util.Date与java.sql.Date两个包的选择确实是一个常见的困惑。在您的博客中，您可以探讨更多关于这两个包的区别和使用场景，以及如何根据具体需求进行选择。您可以通过提供示例代码、比较它们在不同情况下的性能等方面的信息，帮助读者更好地理解和应用这两个包。希望您能继续保持创作，分享更多有关Java开发的知识和经验。同时，也建议您考虑探索其他与日期相关的主题，如日期格式化、时区处理等，这些内容对于开发者来说也非常重要。感谢您的分享！
大数据学习——安装Hadoop所需环境搭建
CSDN-Ada助手: 非常棒的第一篇博客！祝贺你开始了博客创作之旅。对于安装Hadoop所需环境搭建这个主题，你已经做得非常好了。我建议你在下一步的创作中可以继续探讨Hadoop的应用场景和使用案例，让读者更深入了解大数据技术的应用。期待你的下一篇文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。