概括
在这篇文章中,您发现了一种可靠的方法来评估您的深度学习模型在未见数据上的性能的重要性。
您发现了三种可以使用 Keras 库在 Python 中评估深度学习模型性能的方法:
- 使用自动验证数据集。
- 使用手动验证数据集。
- 使用手动 k 折交叉验证。
Keras 是一个易于使用且功能强大的 Python 库,用于深度学习。
在设计和配置深度学习模型时,需要做出很多决定。这些决定中的大多数必须通过反复试验并根据实际数据进行评估来凭经验解决。
因此,拥有一种可靠的方法来评估您的神经网络和深度学习模型的性能至关重要。
在这篇文章中,您将发现一些可用于使用 Keras 评估模型性能的方法。
凭经验评估网络配置
在设计和配置深度学习模型时,您必须做出无数决定。
其中许多决策可以通过复制其他人的网络结构并使用启发式方法来解决。最终,最好的技术是实际设计小型实验并使用真实数据凭经验评估选项。
这包括高级决策,例如网络中层的数量、大小和类型。它还包括较低级别的决策,例如损失函数的选择、激活函数、优化过程和时期数。
深度学习通常用于具有非常大数据集的问题。那是数万或数十万个实例。
因此,您需要有一个强大的测试工具,允许您估计给定配置在看不见的数据上的性能,并可靠地将性能与其他配置进行比较。
数据拆分
大量的数据和模型的复杂性需要非常长的训练时间。
因此,通常将数据简单地分离为训练和测试数据集或训练和验证数据集。
Keras 提供了两种方便的方式来评估你的深度学习算法:
- 使用自动验证数据集。
- 使用手动验证数据集。
使用自动验证数据集
Keras 可以将您的一部分训练数据分离到一个验证数据集中,并在每个 epoch 评估您的模型在该验证数据集上的性能。
您可以通过将fit () 函数上的validation_split参数设置为训练数据集大小的百分比来做到这一点。
例如,对于保留用于验证的 20% 或 33% 的训练数据,一个合理的值可能是 0.2 或 0.33。
下面的示例演示了在小型二进制分类问题上使用自动验证数据集。这篇文章中的所有示例都使用了Pima Indians onset of diabetes 数据集。您可以从 UCI 机器学习存储库下载它,并将数据文件保存在您当前的工作目录中,文件 名为 pima-indians-diabetes.csv (更新:从此处下载)。
# MLP with automatic validation set
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
import numpy