Python深度学习之机器学习基础

最新推荐文章于 2024-06-25 09:51:50 发布

CDFMLR

最新推荐文章于 2024-06-25 09:51:50 发布

阅读量450

点赞数 1

分类专栏： Python深度学习文章标签： python 机器学习人工智能神经网络

本文链接：https://blog.csdn.net/u012419550/article/details/107255867

版权

本文是《Deep Learning with Python》笔记，涵盖了机器学习的四个分支：监督学习、无监督学习、自监督学习和强化学习。讨论了模型评估方法，如训练集、验证集和测试集的划分，并介绍了过拟合和欠拟合的解决方案，包括增加数据量、减少网络大小、正则化和dropout。此外，还强调了数据预处理、特征工程在深度学习中的重要性。

摘要由CSDN通过智能技术生成

Deep Learning with Python

这篇文章是我学习《Deep Learning with Python》(第二版，François Chollet 著) 时写的系列笔记之一。文章的内容是从 Jupyter notebooks 转成 Markdown 的，当我完成所以文章后，会在 GitHub 发布我写的所有 Jupyter notebooks。

你可以在这个网址在线阅读这本书的正版原文(英文)：https://livebook.manning.com/book/deep-learning-with-python

这本书的作者也给出了一套 Jupyter notebooks：https://github.com/fchollet/deep-learning-with-python-notebooks

本文为 第4章机器学习基础 (Chapter 4. Fundamentals of machine learning) 的笔记整合。

本文目录：

文章目录

Deep Learning with Python

机器学习的四个分支

4.1 Four branches of machine learning

监督学习
无监督学习
自监督学习
强化学习

机器学习模型评估

4.2 Evaluating machine-learning models

训练集、验证集和测试集

训练集：用来学习参数（网络里各节点的权重）；
验证集：用来学习超参数（网络的权重，比如层数、层的大小这种）；
测试集：用来验证结果，要保证模型从未见过这些数据。

测试集必须是单独分出来的，训练集、测试集中不能和测试集有重合。

最好的做法是，先把所有数据分成训练集和测试集。然后从训练集里分一部分出来做验证集。

以下是几种选择验证集的方法：

简单留出验证

SIMPLE HOLD-OUT VALIDATION

就是简单的从训练集里留出一部分来做验证集。

可用的数据多的时候才能用这个。不然数据少了，分出来的验证集就太小，不够一般，效果不好。

简单留出验证的示意图

# Hold-out validation

num_validation_samples = 10000

np.random.shuffle(data)    # 洗牌，打乱数据

validation_data = data[:num_validation_samples]    #定义验证集
data = data[num_validation_samples:]

training_data = data[:]    # 定义训练集

# 在训练集训练模型，在验证集评估
model = get_model()
model.train(training_data)
validation_score = model.evaluate(validation_data)

## 然后这里可以根据结果调整模型，
## 然后重新训练、评估，然后再次调整...

# 在调整好超参数之后，用除了测试集的所有数据来训练最终模型
model = get_model()
model.train(np.concatenate([training_data, validation_data]))

# 用测试集来评估最终模型
test_score = model.evaluate(test_data)

K折验证

K-FOLD VALIDATION

这个方法是把数据等分成 K 份。对每个部分 i，在剩下的 K-1 个部分里训练，在 i 上验证评估。最终验证的结果取 K 次的验证值的平均。

这种方法对不同的训练、验证集划分对结果影响比较大时会很有效（比如数据比较少的时候）

K折验证示意图

emmm，我觉得这个图有点问题，应该除了那些灰色的是 Validation，白的应该都是 Training。（中文译本上就是这种）

# K-fold cross-validation

k = 4
num_validation_samples = len(data) // k

np.rand

最低0.47元/天解锁文章

CDFMLR

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python深度学习之机器学习基础

学习《Deep Learning with Python》第二版François Chollet 时写的笔记。介绍：机器学习的四个分支，机器学习模型评估，数据预处理、特征工程和特征学习，过拟合和欠拟合，机器学习的通用工作流程。
复制链接

扫一扫

专栏目录