cnn测试集准确率比训练集低_【ML-Titanic】（五）训练模型评估测试集

最新推荐文章于 2022-09-08 11:56:36 发布

weixin_39946534

最新推荐文章于 2022-09-08 11:56:36 发布

阅读量915

点赞数

文章标签： cnn测试集准确率比训练集低

本文链接：https://blog.csdn.net/weixin_39946534/article/details/112118599

版权

在Titanic数据集上训练随机梯度下降（SGD）分类器，模型在训练集上得到的准确率为0.6036，召回率为0.6813。对测试集进行预处理并预测，最终在Kaggle上得分0.69856。文章探讨了模型表现及优化可能性。

摘要由CSDN通过智能技术生成

通过对Titanic船上人员的信息来判断是否生还，已经明确过这是一个二元分类器。训练样本数据已经全部处理完，并保存在df变量中，接下来就可以训练模型进行数据训练。

接着就需要开始选择一个分类器进行训练了，目前先选择随机梯度下降（SGD）分类器。

训练模型

使用sklearn的SGDClassifier进行非常的方便，大致流程如下：

将Pandas转为Numpy
将输入和输出分别赋值给X，y
使用SGD分类器进行数据训练
获取训练结果的准确率和召回率

这段代码很短，具体如下所示：

from sklearn.linear_model import SGDClassifier
from sklearn.model_selection import cross_val_predict
from sklearn.metrics import precision_score, recall_score

train_df = df.filter(regex='Survived|Age|SibSp|Parch|Fare_.*|Cabin_.*|Embarked_.*|Sex_.*|Pclass_.*')
train_np = train_df.values
X, y = train_np[:, 1:], train_np[:,

最低0.47元/天解锁文章

weixin_39946534

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
cnn测试集准确率比训练集低_【ML-Titanic】（五）训练模型评估测试集

通过对Titanic船上人员的信息来判断是否生还，已经明确过这是一个二元分类器。训练样本数据已经全部处理完，并保存在df变量中，接下来就可以训练模型进行数据训练。接着就需要开始选择一个分类器进行训练了，目前先选择随机梯度下降（SGD）分类器。训练模型使用sklearn的SGDClassifier进行非常的方便，大致流程如下：将Pandas转为Numpy将输入和输出分别赋值给X，y使用SGD分类器进...
复制链接

扫一扫