AI-作业1

凯尼拉

已于 2023-03-15 11:15:55 修改

阅读量241

点赞数 2

文章标签：人工智能机器学习

于 2023-03-15 11:11:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39898476/article/details/129546430

版权

1.监督学习，无监督学习

监督学习是一种机器学习方法，是指：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。是一个由已知（已知类别的样本）推导未知（新的实例）的过程。

无监督学习也是一种机器学习方法，由于缺乏足够的先验知识，因此难以人工标注类别或进行人工类别标注的成本太高。很自然地，我们希望计算机能代我们完成这些工作，或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题，称之为无监督学习。可以说无监督学习是一个从未知（类别未知的训练样本）推导出已知（其中的对应关系）。

2.分类，回归

其本质是一样的，都是对输入值进行预测，并且都是监督学习。

二者的不同在于输出不同

分类是指将数据分成不同的类别或标签，它的输出是物体所属的类别。而回归是指对数据进行预测，以输出一个连续的数值，它的输出是物体的值。

例如我要预测明天的天气，分类是对过去几天的天气（例如周一晴，周二阴，周三多云等等）进行研究，来推导出明天的天气是晴还是多云。而回归则会对前几日的气温进行研究，来推导出明天的气温。

3.聚类，降维

聚类是指分别将具有相似的特征的数据分类成数个组，使得组内的数据相似度尽可能高，组间的数据相似度尽可能低。他的输出是多个数类中心点向量和一个模糊矩阵。使用案例包括细分客户、新闻聚类、文章推荐等

降维是一个去掉冗余的不重要的变量，而只留下主要的可以保持信息的变量的过程。输出是一组描述原数据的，低维度的隐式特征（或称主要特征）。用于消除噪声、对抗数据稀疏问题，进行数据压缩

4.损失函数

损失函数是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。通常来说，损失函数越小，模型的预测结果就越接近真实结果。在应用中，损失函数通常作为学习准则与优化问题相联系，即通过最小化损失函数求解和评估模型。

5.训练集、测试集和验证集

训练集：用于训练模型以及确定参数。相当于学习知识。

验证集：用于确定网络结构以及调整模型的超参数。相当于课后测验检测学习效果并且查漏补缺

测试集：用于检验模型的泛化能力。是期末考试评估这个模型到底怎样。

6.过拟合，欠拟合

过拟合是指为了得到一致假设而使假设变得过度严格。避免过拟合是分类器设计中的一个核心任务。例如只认为枫树叶属于树叶，而柳树叶不属于树叶。

通常的解决方法有选取合适的停止训练标准，使对机器的训练在合适的程度；保留验证数据集，对训练成果进行验证；获取额外数据进行交叉验证；正则化。

欠拟合是指模型拟合程度不高，数据距离拟合曲线较远，或指模型没有很好地捕捉到数据特征，不能够很好地拟合数据。例如认为枫树叶属于树叶，而整棵枫树也认为属于树叶。

常见的解决方法有增加新特征；添加多项式特征；减少正则化参数；使用非线性模型调整模型的容量。

7.经验风险，期望风险

对于某个样本,其真实的标签为,我们用模型 f(x,w) 来估计, 其中是模型的参数。则：

经验风险是指模型在整个训练数据集上的误差的均值。通常来说，经验风险越小，表示模型在训练集上的表现越好。

$R_{emp}(w)=\frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i,w))$

期望风险指的是模型模型在所有可能出现的样本（包括训练集，测试集和其它未采集的样本）上的误差的均值。通常来说，期望风险越小，表示模型的泛化能力越强，即能够更好地适应新数据。

$R_{exp}(w)=\int L(y,f(x,w))dF(x,y)$

其中， F(x,y) 表示所有可能出现的样本及其标签的联合概率分布。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

凯尼拉 CSDN认证博客专家 CSDN认证企业博客

码龄7年

12: 原创

131万+: 周排名

95万+: 总排名

1792: 访问

: 等级

124: 积分

25: 粉丝

4: 获赞

2: 评论

3: 收藏

私信

关注

热门文章

最新评论

AI作业4-无监督学习
CSDN-Ada助手: 恭喜您完成了第四篇博客！无监督学习是一个非常有趣的领域，也是机器学习中的重要一环。您的文章让我对这个领域有了更深入的了解。接下来，我建议您可以尝试探索一些无监督学习的实际应用场景，例如聚类、降维等，这样可以更好地帮助读者理解无监督学习的实际价值。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
AI-作业1
CSDN-Ada助手: 恭喜您的文章入围每天最佳新人「2023-03-16」榜单, 排名「31」, 一定要再接再厉哦, 创作更多高质量博客, 争取拿到更好成绩, 全部的排名请看: https://bbs.csdn.net/topics/614083590 更多创作活动请看: 原力计划S5 -- 寻找1000位优秀创作者: https://marketing.csdn.net/p/5352d383bcbb5346dc3430e9643d3255?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 「IT女神勋章」挑战赛--以创作之名致敬女性开发者: https://activity.csdn.net/creatActivity?id=10305&utm_source=csdn_ai_ada_redpacket
AI-作业1
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
AI-作业1
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/614083590。

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。