机器学习重点内容概述

Eric.ZhaiHonglei

于 2024-05-04 22:34:29 发布

阅读量198

点赞数 8

文章标签：机器学习人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_54830080/article/details/137518567

版权

本文详细介绍了有监督学习和无监督学习的特点、区别，以及机器学习的建模流程，包括数据获取、预处理、特征工程、模型训练和评估。同时探讨了模型拟合问题及其产生原因，如欠拟合和过拟合。

摘要由CSDN通过智能技术生成

1.说明有监督学习和无监督学习的各自的特点及区别

有监督学习的特点:

输入数据是由输入特征值和目标值所组成, 即输入的训练数据是有标签的.
- 数据集: 需要人工标注数据.

无监督学习的特点:

输入的数据没有被标记, 没有标签;
根据样本间的相似性, 对样本集聚类, 以发现事物内部的结构及相互关系.

区别:

有监督学习输入的数据是有标签的, 而无监督学习输入的数据是无标签的。区别如下图：

2. 说明下机器学习的建模流程

1. 获取数据

2. 数据基本处理

3. 特征工程

4. 机器学习(模型训练)

5. 模型评估

注意：

在整个建模流程中, 数据基本处理和特征工程一般是耗时, 耗精力最多的！！！

3.说下模型拟合问题及产生的原因

模型拟合会出现三种情况:

刚好拟合: 表示模型对样本点的拟合情况刚刚好.
- 原因: 特征选取和模型选取及训练刚刚好.

欠拟合: 模型在训练集上表现很差、在测试集表现也很差.
- 原因: 模型过于简单.

过拟合: 模型在训练集上表现很好、在测试集表现很差.
- 原因: 模型过于复杂, 数据不纯, 训练数据太小.

Eric.ZhaiHonglei

关注

8
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习重点内容概述

有监督学习输入的数据是有标签的, 而无监督学习输入的数据是无标签的。在整个建模流程中, 数据基本处理和特征工程一般是耗时, 耗精力最多的！根据样本间的相似性, 对样本集聚类, 以发现事物内部的结构及相互关系.输入数据是由输入特征值和目标值所组成, 即输入的训练数据是有标签的.欠拟合: 模型在训练集上表现很差、在测试集表现也很差.过拟合: 模型在训练集上表现很好、在测试集表现很差.原因: 模型过于复杂, 数据不纯, 训练数据太小.刚好拟合: 表示模型对样本点的拟合情况刚刚好.原因: 模型过于简单.
复制链接

扫一扫

Eric.ZhaiHonglei CSDN认证博客专家 CSDN认证企业博客

码龄4年

2: 原创

157万+: 周排名

20万+: 总排名

444: 访问

: 等级

32: 积分

13: 粉丝

11: 获赞

1: 评论

3: 收藏

私信

关注

热门文章

最新评论

埃隆·马斯克：开源大模型grok-1地址
CSDN-Ada助手: 恭喜您开启了博客创作之旅！埃隆·马斯克是一个备受瞩目的人物，关于他的开源大模型grok-1地址的分享无疑会引起很多人的关注和讨论。建议在接下来的创作中，可以深入探讨这个大模型的应用场景、技术原理以及未来的发展方向，让读者们能够更全面地了解这一主题。期待您的更多精彩内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

埃隆·马斯克：开源大模型grok-1地址

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。