任务3.模型构建

最新推荐文章于 2022-01-17 17:42:17 发布

qq_43585786

最新推荐文章于 2022-01-17 17:42:17 发布

阅读量235

点赞数

本文链接：https://blog.csdn.net/qq_43585786/article/details/86017648

版权

根据之前的预处理，未排序的数据使得前891行被选为训练集，现在准备构建模型。针对分类问题，选择了逻辑回归、SVM和决策树三种模型进行尝试，其中决策树在实验中表现出最高的准确性。

摘要由CSDN通过智能技术生成

之前任务中将训练集和测试集一起处理，数据处理完成后需要将训练集和测试集分离开来。前边并没有做过排序，因此顺序没有改变，直接取前891行就是训练集。

#训练集：特征
X_train = integDF_X.loc[:890,:]
#训练集：标签
Y_train = integDF.loc[:890,'Survived']
#测试集：特征
X_test = integDF_X.loc[891:,:]
#观察行是否正确
print(X_train.shape)
print(X_test.shape)
from sklearn.model_selection import train_test_split #拆分数据集
x_train,x_test,y_train,y_test =train_test_split(X_train,Y_train,test_size=0.3,random_state=42)   #随机种子数 
x_train.head()

现在我们已经做好了训练模型的准备，我们希望找出输出（即Survived）与所挑选出来的特征（即Gender，Age等）之间的关系，是一个分类的问题。选择以下模型：
1.逻辑回归

from sklearn.linear_model import LogisticRegression
logreg = LogisticRegression()
logreg.fit(x_train, y_train)
Y_pred = logreg.predict(x_test)
acc_log = round(logreg.score(x_train, y_train) * 100, 2)
print( '准确率：',acc_log,'%')
#输出 准确率：83.73%
<

最低0.47元/天解锁文章

qq_43585786

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
任务3.模型构建

之前任务中将训练集和测试集一起处理，数据处理完成后需要将训练集和测试集分离开来。前边并没有做过排序，因此顺序没有改变，直接取前891行就是训练集。#训练集：特征X_train = integDF_X.loc[:890,:]#训练集：标签Y_train = integDF.loc[:890,'Survived']#测试集：特征X_test = integDF_X.loc[891:,:]...
复制链接

扫一扫