MOOC《人工智能：模型与算法》笔记 chapter 5

景云m

于 2024-05-03 14:34:42 发布

阅读量542

点赞数 3

分类专栏： MOOC《人工智能：模型与算法》笔记文章标签：人工智能算法笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wbupt2021/article/details/138396985

版权

MOOC《人工智能：模型与算法》笔记专栏收录该内容

5 篇文章

订阅专栏

本文介绍了机器学习中的监督学习方法，包括数据特征提取、线性回归示例以及提升算法中的AdaBoosting。通过实例演示了如何使用线性回归分析变量关系，并探讨了如何通过弱分类器的组合形成强大分类器，涉及霍夫丁不等式和PAC理论。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这一章围绕机器学习中的一个重要方法——监督学习展开，分别从机器学习的基本概念，线性回归分析，提升算法三个方面来介绍。

一·机器学习: 从数据中学习知识

机器学习:

1. 原始数据中提取特征

2. 学习映射函数 𝑓

3. 通过映射函数 𝑓 将原始数据映射到语义空间，即寻找数据和任务目标之间的关系

机器学习的分类 ：

1.监督学习 (supervised learning)

数据有标签、一般为回归或分类等任务

2.无监督学习 (un-supervised learning)

数据无标签、一般为聚类或若干降维任务

3.强化学习 (reinforcement learning)

序列数据决策学习，一般为与从环境交互中学习

可以将1，2合称为半监督学习

对于监督学习所达到的效果，我们期望的是经验风险和期望风险都很小，除了这一种可能性，往往还会出现以下可能情况。

二·线性回归(linear regression)

线性回归是监督学习的主要学习任务之一。在现实生活中，往往需要分析若干变量之间的关系，如碳排放量与气候变暖之间的关系、某一商品广告投入量与该商品销售量之间的关系等，这种分析不同变量之间存在关系的研究叫回归分析，刻画不同变量之间关系的模型被称为回归模型。如果这个模型是线性的，则称为线性回归模型。

下面以莫纳罗亚山（夏威夷岛的活火山）从1970年到2005年每5年的二氧化碳浓度为例，介绍线性回归。

根据表中的x,y可以求解出a,b的值。因此可以得到：预测莫纳罗亚山地区二氧化碳浓度的一元线性回归模型为“ 二氧化碳浓度 =1.5344 × 时间年份 − 2698.9” ，即𝑦 = 1.5344𝑥 − 2698.9。

三·提升算法

3.1Boosting (adaptive boosting, 自适应提升)：

对于一个复杂的分类任务，可以将其分解为若干子任务，然后将若干子任务完成方法综合，最终完成该复杂任务。

将若干个弱分类器 (weak classifiers) 组合起来，形成一个强分类器(strong classifier) 。

3.2计算学习理论：

霍夫丁不等式(Hoeffding’s inequality)

概率近似正确 (probably approximately correct, PAC)

对于统计电视节目收视率这样的任务，可以通过不同的采样方法（即不同模型）来计算收视率。每个模型会产生不同的误差。问题：如果得到完成该任务的若干“弱模型”，是否可以将这些弱模型组合起来，形成一个“强模型”。该“强模型” 产生误差很小呢？这就是概率近似正确（PAC）要回答的问题。

3.3Ada Boosting 实现：

思路描述

Ada Boosting 算法中两个核心问题：

在每个弱分类器学习过程中，如何改变训练数据的权重：提高在上一轮中分类错误样本的权重。

如何将一系列弱分类器组合成强分类器：通过加权多数表决方法来提高分类误差小的弱分类器的权重，让其在最终分类中起到更大作用。同时减少分类误差大的弱分类器的权重，让其在最终分类中仅起到较小作用。

博客等级

码龄3年

24
原创

99
点赞

72
收藏

59
粉丝

关注

私信

热门文章

分类专栏

Python学习笔记 10篇
MOOC《人工智能：模型与算法》笔记 5篇

最新评论

MOOC《人工智能：模型与算法》笔记 chapter 5 线性回归应用——基于回归分析的有损图像恢复
CSDN-Ada助手: 恭喜您撰写了第13篇博客，内容涉及MOOC《人工智能：模型与算法》中线性回归在有损图像恢复中的应用，非常值得称赞！在这篇博客中，您对回归分析的应用进行了深入探讨，展现了您对人工智能领域的深刻理解和研究热情。希望您能继续保持创作的热情，探索更多前沿领域的知识，为读者呈现更多有价值的内容。或许在下一篇博客中，您可以尝试结合实际案例，进一步展示线性回归在其他领域的应用，让读者更加深入理解其在不同场景下的实际作用。期待您的下一篇作品！
MOOC《人工智能：模型与算法》笔记 chapter 6
CSDN-Ada助手: 恭喜您发布了第14篇博客！阅读您的《人工智能：模型与算法》笔记 chapter 6，我感觉收获颇丰。希望您能继续分享您的学习心得，为大家带来更多有价值的内容。下一步建议可以考虑深入探讨一些实际案例或者应用场景，让读者更好地理解和应用所学知识。期待您的下一篇作品！
MOOC《人工智能：模型与算法》笔记 chapter 2
CSDN-Ada助手: 恭喜您第10篇博客的问世！阅读您的《MOOC《人工智能：模型与算法》笔记 chapter 2》，受益匪浅。希望您能继续保持创作的热情和耐心，分享更多有价值的知识给大家。或许在下一篇博客中，可以结合实际案例或者个人见解，让读者更深入地理解这门课程的内容。期待您更多精彩的作品！
MOOC《人工智能：模型与算法》笔记 chapter 3
CSDN-Ada助手: 恭喜您撰写第11篇博客！看到您对MOOC《人工智能：模型与算法》第三章的学习笔记，让我感到十分欣慰。在您持续创作的过程中，建议您可以尝试加入更多实例分析或个人见解，这样可以使您的博客内容更加生动和具有吸引力。期待您更多精彩的创作，加油！
MOOC《人工智能：模型与算法》笔记 chapter 5
CSDN-Ada助手: 恭喜您第12篇博客《MOOC《人工智能：模型与算法》笔记 chapter 5》的发布！您对人工智能领域的学习和总结让人印象深刻，不断分享知识的精神令人钦佩。希望您能继续坚持创作，可以考虑扩大内容覆盖范围，探讨更多领域的知识，让更多读者受益。期待您的下一篇作品！愿您在学习与写作的道路上不断进步，谢谢您的分享！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。