如果把机器学习的最终成果比做为做一道菜的话,那么数 据准备和处理,就相当于买食材并 挑选、洗清、处理食材的过程。
一 导包
#逻辑回归算法
from sklearn.linear_model import LogisticRegression
#随机分割数据集
from sklearn.model_selection import train_test_split
#输出模型评估报告
from sklearn.metrics import classification_report
#相当于把“泰坦尼克号数据特征工程完整流程.ipynb ”文件中的代码
%run 泰坦尼克号数据特征工程完整流程.ipynb
TrainData.head()
训练集中一定要删除目标值,因为这个值是要训练得出的
#从训练数据集中,拆分出特征变量
trainData_X = TrainData.drop(['Survived'], axis = 1)
trainData_X.head()