cnn测试集准确率比训练集低_【ML-Titanic】(五)训练模型评估测试集

在Titanic数据集上训练随机梯度下降(SGD)分类器,模型在训练集上得到的准确率为0.6036,召回率为0.6813。对测试集进行预处理并预测,最终在Kaggle上得分0.69856。文章探讨了模型表现及优化可能性。
摘要由CSDN通过智能技术生成

4ebe37a1288fce573fc80b77b6093786.png

通过对Titanic船上人员的信息来判断是否生还,已经明确过这是一个二元分类器。训练样本数据已经全部处理完,并保存在df变量中,接下来就可以训练模型进行数据训练。

接着就需要开始选择一个分类器进行训练了,目前先选择随机梯度下降(SGD)分类器。

训练模型

使用sklearn的SGDClassifier进行非常的方便,大致流程如下:

  1. 将Pandas转为Numpy
  2. 将输入和输出分别赋值给X,y
  3. 使用SGD分类器进行数据训练
  4. 获取训练结果的准确率和召回率

这段代码很短,具体如下所示:

from sklearn.linear_model import SGDClassifier
from sklearn.model_selection import cross_val_predict
from sklearn.metrics import precision_score, recall_score

train_df = df.filter(regex='Survived|Age|SibSp|Parch|Fare_.*|Cabin_.*|Embarked_.*|Sex_.*|Pclass_.*')
train_np = train_df.values
X, y = train_np[:, 1:], train_np[:,
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值