任务3.模型构建

根据之前的预处理,未排序的数据使得前891行被选为训练集,现在准备构建模型。针对分类问题,选择了逻辑回归、SVM和决策树三种模型进行尝试,其中决策树在实验中表现出最高的准确性。
摘要由CSDN通过智能技术生成

之前任务中将训练集和测试集一起处理,数据处理完成后需要将训练集和测试集分离开来。前边并没有做过排序,因此顺序没有改变,直接取前891行就是训练集。

#训练集:特征
X_train = integDF_X.loc[:890,:]
#训练集:标签
Y_train = integDF.loc[:890,'Survived']
#测试集:特征
X_test = integDF_X.loc[891:,:]
#观察行是否正确
print(X_train.shape)
print(X_test.shape)
from sklearn.model_selection import train_test_split #拆分数据集
x_train,x_test,y_train,y_test =train_test_split(X_train,Y_train,test_size=0.3,random_state=42)   #随机种子数 
x_train.head()

现在我们已经做好了训练模型的准备,我们希望找出输出(即Survived)与所挑选出来的特征(即Gender,Age等)之间的关系,是一个分类的问题。选择以下模型:
1.逻辑回归

from sklearn.linear_model import LogisticRegression
logreg = LogisticRegression()
logreg.fit(x_train, y_train)
Y_pred = logreg.predict(x_test)
acc_log = round(logreg.score(x_train, y_train) * 100, 2)
print( '准确率:',acc_log,'%')
#输出 准确率:83.73%
<
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值