机器学习概述2

最新推荐文章于 2024-08-31 15:42:00 发布

m0_47099463

最新推荐文章于 2024-08-31 15:42:00 发布

阅读量751

点赞数 22

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_47099463/article/details/140833107

版权

算法分类

学习目标

1.知道有监督学习是什么？

2.知道无监督学习是什么？

3.知道半监督学习是什么？

4.了解强化学习是什么？

5.能掌握监督学习、无监督学习的数学表示

【掌握】有监督学习

定义：输入数据是由输入特征值和目标值所组成，即输入的训练数据有标签的
数据集：需要人工标注数据

【掌握】分类

目标值（标签值）是不连续的
分类种类：二分类、多分类任务、

在这里插入图片描述

【掌握】回归

目标值（标签值）是连续的

在这里插入图片描述

【熟悉】无监督学习

定义：输入数据没有被标记，即样本数据类别未知，没有标签，根据样本间的相似性，对样本集聚类，以发现事物内部结构及相互关系。
数据集：不需要标注数据

在这里插入图片描述

无监督学习特点：

1 训练数据无标签

2 根据样本间的相似性对样本集进行聚类，发现事物内部结构及相互关系

在这里插入图片描述

【了解】半监督学习

工作原理：

1 让专家标注少量数据，利用已经标记的数据（也就

是带有类标签）训练出一个模型

2 再利用该模型去套用未标记的数据

3 通过询问领域专家分类结果与模型分类结果做对比，

从而对模型做进一步改善和提高

在这里插入图片描述

半监督学习方式可大幅降低标记成本

【了解】强化学习

1 强化学习（Reinforcement Learning）：机器学习的一个重要分支

2 应用场景：里程碑AlphaGo围棋、各类游戏、对抗比赛、无人驾驶场景

3 基本原理：基本原理：通过构建四个要素：agent，环境状态，行动，奖励，

agent根据环境状态进行行动获得最多的累计奖励。。

在这里插入图片描述

小孩子学走路：

(1) 小孩就是 agent，他试图通过采取行（即行走）来操纵环境（地面），

(2) 并且从一个状态转变到另一个状态（即他走的每一步），

(3) 当他完成任务的子任务（即走了几步）时，孩子得到奖励（给巧克力吃），

(4) 并且当他不能走路时，就不会给巧克力。

总结

在这里插入图片描述

在这里插入图片描述

【知道】机器学习的建模流程

在这里插入图片描述

在这里插入图片描述

特征工程

学习目标：

1.知道特征工程是什么？

2.理解特征提取的作用

3.理解特征预处理的作用

4.了解特征降维、特征选择、特征组合

【知道】特征工程

在这里插入图片描述

从数据集角度来看：一列一列的数据为特征。

从模型训练角度来看：对预测结果有用的属性为特征

特征工程是：利用专业背景知识和技巧处理数据，让机器学习算法效果最好。这个过程就是特征工程

Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learning” is basically feature engineering. ”

释义：特征工程是困难、耗时、需要专业知识。应用机器学习基础就是特征工程

【理解】数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。

【理解】特征提取

从原始数据中提取与任务相关的特征，构成特征向量

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

在这里插入图片描述

对于文本、图片这种非行列形式的数据行列形式转换，

一旦转换成行列形式一列就是特征

【理解】特征预处理

特征对模型产生影响；因量纲问题，有些特征对模型影响大、有些影响小

在这里插入图片描述

将不同的单位的特征数据转换成同一个范围内

使训练数据中不同特征对模型产生较为一致的影响

【了解】特征降维

将原始数据的维度降低，叫做特征降维

在这里插入图片描述

会丢失部分信息。降维就需要保证数据的主要信息要保留下来

原始数据会发生变化，不需要了解数据本身是什么含义，它保留了最主要的信息

【了解】特征选择

原始数据特征很多，但是对任务相关是其中一个特征集合子集。

在这里插入图片描述

从特征中选择出一些重要特征（选择就需要根据一些指标来选择）

特征选择不会改变原来的数据

【了解】特征组合

把多个的特征合并成一个特征。

在这里插入图片描述

通过加法、乘法等方法将特征值合并

在这里插入图片描述

【掌握】模型拟合问题

学习目标：

1.知道拟合是什么？

2.理解过拟合、欠拟合是什么？

3.知道过拟合、欠拟合出现的原因

4.理解泛化是什么？

拟合：用来表示模型对样本点的拟合情况

欠拟合：模型在训练集上表现很差、在测试集表现也很差

原因：模型过于简单

过拟合：模型在训练集上表现很好、在测试集表现很差

原因：模型太过于复杂、数据不纯、训练数据太少

泛化：模型在新数据集（非训练数据）上的表现好坏的能力

奥卡姆剃刀原则：给定两个具有相同泛化误差的模型，较简单的模型比较复杂的模型更可取

【实操】机器学习开发环境

基于Python的 scikit-learn 库：

简单高效的数据挖掘和数据分析工具
可供大家使用，可在各种环境中重复使用
建立在NumPy，SciPy和matplotlib上
开源，可商业使用-获取BSD许可证

pip install scikit-learn

在这里插入图片描述

在这里插入图片描述

关注

22
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
机器学习概述2

机器学习概述2
复制链接

扫一扫

m0_47099463 CSDN认证博客专家 CSDN认证企业博客

码龄4年

14: 原创

115万+: 周排名

9万+: 总排名

4986: 访问

: 等级

217: 积分

78: 粉丝

90: 获赞

4: 评论

84: 收藏

私信

关注

热门文章

最新评论

python基础知识分享04-函数入门2
CSDN-Ada助手: 恭喜您发布了第8篇博客，标题为“python基础知识分享04-函数入门2”。看到您持续分享有关Python基础知识的文章，真是令人欣慰！希望您能继续保持这样的创作热情，不断提升自己的写作水平。如果可能的话，可以考虑增加一些实例代码或者案例分析，让读者更易于理解和接受您的知识分享。期待您的下一篇作品！祝好！
python基础知识分享05-文件操作
CSDN-Ada助手: 恭喜你写了第9篇博客！看到你分享关于Python基础知识中的文件操作的文章，我感到非常兴奋。希望你能继续保持创作的热情和动力，不断分享更多有价值的内容。下一步建议可以考虑深入探讨一些高级的文件操作技巧和实际应用案例，让读者能够更加全面地掌握这方面的知识。期待你的下一篇文章！
python基础知识分享04-函数入门
CSDN-Ada助手: 恭喜您写了第7篇博客！看到您分享关于python函数入门的知识，让我受益匪浅。希望您能继续保持创作的热情，不断分享更多有价值的内容。下一步建议可以深入探讨一些高级函数的应用，这样能够帮助更多读者提升技能。期待您的下一篇博客！祝您创作顺利！
python基础知识分享03-容器类型介绍
CSDN-Ada助手: 恭喜您发布了第5篇博客！标题为“python基础知识分享03-容器类型介绍”真是精彩之作。希望您能继续坚持创作，分享更多有趣的内容。下一步建议可以考虑深入探讨Python容器类型的应用场景或者与其他数据结构的对比分析，让读者更深入地了解这一知识点。期待您的下一篇作品！
做个迷宫小游戏
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。