Datawhale吃瓜教程Task01西瓜书-机器学习理论

Task1:
周志华老师的《机器学习》经常用“西瓜”作为讲解案例,书籍封面也是西瓜的卡通图,因此被江湖人称作“西瓜书”。

在本次的教学视频导学部分介绍了相关专业术语及其关系:人工智能 > 机器学习 > 深度学习。人工智能在应用领域涵盖了计算机视觉(CV)、自然语言处理(NLP)、推荐系统(RS)等。我的学习目标是为了能够灵活运用机器学习算法。

关于《西瓜书》的第一章绪论,通过挑选西瓜的例子,主要介绍了后续章节会用到的基本概念,,如数据集、样本、属性/特征、算法、泛化等,假设空间、归纳偏好(这让我想到了特征选择和模糊数学)。这一章还介绍了人工智能的发展历程,包括20世纪50年代到70年代的推理期和知识期,以及20世纪80年代至今的符号主义学习、连接主义学习等发展阶段。随着互联网和计算机的发展,机器学习越来越多地渗透到我们的生活中,对于我们的生活、工作和社交都产生了深远的影响,甚至对一些产业的发展方向产生了影响。

第二章是关于模型评估与选择。介绍了机器学习的假设空间和有监督学习、无监督学习等基本分类。假设空间由样本特征所有可能假设组成。有监督学习训练数据有明确的标记,而无监督学习则相反。我们通常将一组数据划分为训练集、验证集(用于评估测试)和测试集,分别用于训练误差(经验误差)和泛化误差的评估。过拟合是指学习过于强大,在训练时学到了不太一般的特征,表现出色于训练数据但在未见数据上表现较差。相反,欠拟合无法很好地学习到数据集上的特征,无法捕捉数据中的真实模式和关系。在训练模型时,为了获得好的性能,需要调整一些参数进行调优。对于模型性能的度量,在回归中常用均方误差来描述并尽量最小化。需要理解的是,算法并没有绝对的好坏,只有在解决特定问题时某个算法更适合反映数据的规律。数据决定模型的上限,而算法则是让模型无限逼近这一上限的工具。

通过学习西瓜书,我逐渐理解了机器学习算法的原理和应用,并且意识到这些算法可以迁移运用到其他领域。在机器学习中,我们需要对数据进行处理和分析,从而发掘出数据中的规律和模式。这些算法可以应用于各种不同的领域,例如金融、医疗、教育等。

在学习过程中,我逐渐了解了各种专业术语和概念,如假设空间、归纳偏好等。这些术语和概念对于理解机器学习的原理和应用非常重要。同时,我也了解到了一些机器学习的分支和发展趋势,例如强化学习和深度学习等。

  • 9
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值