Python 深度学习 Class 4：机器学习基础

最新推荐文章于 2024-09-11 15:11:33 发布

By4te

最新推荐文章于 2024-09-11 15:11:33 发布

阅读量478

点赞数

分类专栏： Python 深度学习文章标签：机器学习深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_49939117/article/details/122243135

版权

Python 同时被 2 个专栏收录

42 篇文章 2 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

目录

4.1 机器学习分支

2.无监督学习

3.自监督学习

4.2 评估机器学习模型

4.3 数据预处理、特征工程和特征学习

4.3 过拟合与欠拟合

1.减小网络大小

2.权重正则化

4.5 通用工作流程

1.定义问题，收集数据集

2.选择成功指标

3.确定评估方法

6.开发过拟合模型

7.正则化和调节超参数

玫瑰花香永不消逝

4.1 机器学习分支

1.监督学习

主要包括分类和回归，还有序列生成、语法树预测、目标检测、图像分割等

2.无监督学习

包括降维和聚类

3.自监督学习

没有人工标注的标签的监督学习

4.强化学习

4.2 评估机器学习模型

1.数据划分

在训练数据上训练模型，在验证数据上评估模型，在测试数据上做最终测试

若可用数据很少，可以使用以下几种评估方法。

（1）留出验证

留出一定比例的数据作为测试集。在剩余的数据上训练模型，然后在测试集上评估模型。

（2）K折验证

K折验证：将数据划分为大小相同的K个分区。对于每个分区i，在剩余的K-1 个分区上训练模型，然后在分区i 上评估模型。最终分数等于K 个分数的平均值。

（3）带有打乱数据的重复K 折验证

2.注意事项

（1）数据代表性：在将数据划分为训练集和测试集之前，通常应该随机打乱数据

（2）时间箭头：如果想要根据过去预测未来，那么在划分数据前你不应该随机打乱数据

（3）数据冗余：确保训练集和验证集之间没有交集

4.3 数据预处理、特征工程和特征学习

1.预处理

（1）向量化：神经网络的所有输入和目标都必须是浮点数张量

（2）标准化：输入数据特征：取值较小、同质性

（3）处理缺失值：一般来说，对于神经网络，将缺失值设置为0 是安全的

2.特征工程

指将数据输入模型之前，利用你自己关于数据和机器学习算法（这里指神经网络）的知识对数据进行硬编码的变换（不是模型学到的），以改善模型的效果。

特征工程优点：解决某些问题较为方便；所需数据量小

4.3 过拟合与欠拟合

机器学习的根本问题是优化和泛化之间的对立。优化（optimization）是指调节模型以在训练数据上得到最佳性能（即机器学习中的学习），而泛化（generalization）是指训练好的模型在前所未见的数据上的性能好坏。

正则化方法：

1.减小网络大小

防止过拟合的最简单的方法就是减小模型大小，即减少模型中可学习参数的个数。

要找到合适的模型大小，一般的工作流程是开始时选择相对较少的层和参数，然后逐渐增加层的大小或增加新层，直到这种增加对验证损失的影响变得很小。

2.权重正则化

给定一些训练数据和一种网络架构，很多组权重值（即很多模型）都可以解释这些数据。简单模型（参数值分布的熵更小的模型）比复杂模型更不容易过拟合。

常见降低过拟合法：强制让模型权重只能取较小的值，从而限制模型的复杂度。其实现方法是向网络损失函数中添加与较大权重值相关的成本。

（1）L1正则化化：添加的成本与权重系数的绝对值［权重的L1范数］成正比。

（2）L2正则化：添加的成本与权重系数的平方（权重的L2范数）成正比。神经网络L2正则化也叫权重衰减

3.Dropout

在训练过程中随机将该层的一些输出特征舍弃（设置为0）。dropout 比率（dropout rate）是被设为0 的特征所占的比例，通常在0.2~0.5范围内。

训练时对激活矩阵使用dropout，并在训练时成比例增大。测试时激活矩阵保持不变

4.5 通用工作流程

1.定义问题，收集数据集

2.选择成功指标

平衡分类问题：精度和接收者操作特征曲线下面积

类不平衡问题：准确率和召回率

排序问题或多标签分类：平均准确率均值

3.确定评估方法

4.准备数据

5.模型开发

6.开发过拟合模型

7.正则化和调节超参数

这一步是最费时间的：你将不断地调节模型、训练、在验证数据上评估（这里不是测试数据）、
再次调节模型，然后重复这一过程，直到模型达到最佳性能。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

By4te CSDN认证博客专家 CSDN认证企业博客

码龄4年

93: 原创

29万+: 周排名

117万+: 总排名

5万+: 访问

: 等级

974: 积分

368: 粉丝

27: 获赞

6: 评论

180: 收藏

私信

关注

热门文章

分类专栏

机器学习 36篇
C++ 30篇
Linux 5篇
数据结构 8篇
计算机网络 6篇
操作系统 5篇
元分析 1篇
Sleep stage 1篇
深度学习 10篇
Python 42篇

最新评论

脑电分析工具MNE教程
宸静: 使用scikit-learn进行多分类时，这里报错，TypeError: psd_welch() got an unexpected keyword argument 'picks' 这个怎么解决呢
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络
青青子佩983: 明白了，谢谢
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络
By4te: 卷积核的个数，决定了当前层输出特征图的深度
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络
青青子佩983: 问一下卷积操作的时候为什么是6个5*5的卷积核
C++学习笔记（Ⅳ）：职工管理系统
By4te: 理解： 3节：创建WorkManager（职工管理函数），在头文件中声明，源文件中实现（包含构造和析构函数）。此函数中包含各类功能函数。 4节：菜单展示函数 5节：创建管理函数下的实例，提供菜单选择功能；实现菜单退出功能 6节：创建Worker抽象类（父类），提供父类行为纯虚函数及属性；创建employee、manager、boss子类，并进行属性初始化，提供父类纯虚函数的实现； 7节：头文件声明，源文件实现添加职工函数 8节：析构函数释放堆区内容；添加文件保存函数 9节：以不同方式读取文件 10节：显示职工信息 11节：删除职工 12节：修改职工信息 13节：查找职工 14节：排序 15节：清空文件

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。