Datawhale吃瓜教程Task01西瓜书-机器学习理论

最新推荐文章于 2024-07-25 14:12:59 发布

某小从余雨叚噫

最新推荐文章于 2024-07-25 14:12:59 发布

阅读量367

点赞数 9

文章标签：笔记机器学习算法

本文链接：https://blog.csdn.net/m0_63807165/article/details/134958839

版权

Task1:
周志华老师的《机器学习》经常用“西瓜”作为讲解案例，书籍封面也是西瓜的卡通图，因此被江湖人称作“西瓜书”。

在本次的教学视频导学部分介绍了相关专业术语及其关系：人工智能 > 机器学习 > 深度学习。人工智能在应用领域涵盖了计算机视觉（CV）、自然语言处理（NLP）、推荐系统（RS）等。我的学习目标是为了能够灵活运用机器学习算法。

关于《西瓜书》的第一章绪论，通过挑选西瓜的例子，主要介绍了后续章节会用到的基本概念，，如数据集、样本、属性/特征、算法、泛化等，假设空间、归纳偏好（这让我想到了特征选择和模糊数学）。这一章还介绍了人工智能的发展历程，包括20世纪50年代到70年代的推理期和知识期，以及20世纪80年代至今的符号主义学习、连接主义学习等发展阶段。随着互联网和计算机的发展，机器学习越来越多地渗透到我们的生活中，对于我们的生活、工作和社交都产生了深远的影响，甚至对一些产业的发展方向产生了影响。

第二章是关于模型评估与选择。介绍了机器学习的假设空间和有监督学习、无监督学习等基本分类。假设空间由样本特征所有可能假设组成。有监督学习训练数据有明确的标记，而无监督学习则相反。我们通常将一组数据划分为训练集、验证集（用于评估测试）和测试集，分别用于训练误差（经验误差）和泛化误差的评估。过拟合是指学习过于强大，在训练时学到了不太一般的特征，表现出色于训练数据但在未见数据上表现较差。相反，欠拟合无法很好地学习到数据集上的特征，无法捕捉数据中的真实模式和关系。在训练模型时，为了获得好的性能，需要调整一些参数进行调优。对于模型性能的度量，在回归中常用均方误差来描述并尽量最小化。需要理解的是，算法并没有绝对的好坏，只有在解决特定问题时某个算法更适合反映数据的规律。数据决定模型的上限，而算法则是让模型无限逼近这一上限的工具。

通过学习西瓜书，我逐渐理解了机器学习算法的原理和应用，并且意识到这些算法可以迁移运用到其他领域。在机器学习中，我们需要对数据进行处理和分析，从而发掘出数据中的规律和模式。这些算法可以应用于各种不同的领域，例如金融、医疗、教育等。

在学习过程中，我逐渐了解了各种专业术语和概念，如假设空间、归纳偏好等。这些术语和概念对于理解机器学习的原理和应用非常重要。同时，我也了解到了一些机器学习的分支和发展趋势，例如强化学习和深度学习等。

某小从余雨叚噫

关注

9
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Datawhale吃瓜教程Task01西瓜书-机器学习理论

假设空间由样本特征所有可能假设组成。关于《西瓜书》的第一章绪论，通过挑选西瓜的例子，主要介绍了后续章节会用到的基本概念，，如数据集、样本、属性/特征、算法、泛化等，假设空间、归纳偏好（这让我想到了特征选择和模糊数学）。这一章还介绍了人工智能的发展历程，包括20世纪50年代到70年代的推理期和知识期，以及20世纪80年代至今的符号主义学习、连接主义学习等发展阶段。随着互联网和计算机的发展，机器学习越来越多地渗透到我们的生活中，对于我们的生活、工作和社交都产生了深远的影响，甚至对一些产业的发展方向产生了影响。
复制链接

扫一扫