如果训练集和测试集分开,要合并放在一起进行特征工程。
axis的意思是“轴”,决定了两个数据集是纵向的合并,还是横向的合并。
axis=0是纵向的合并,把很多行合并在一起,由于默认是纵向的合并,axis=0写不写都可以。
axis=1是横向的合并,把很多列合并在一起。
import pandas as pd
train = pd.read_csv('./train.csv')
test = pd.read_csv('./test.csv')
# 合并两个数据集(一起做特征工程)
data = pd.concat([train,test],axis=0)
运行结果:
训练集700行+测试集300行=1000行,就合并好啦!