Excel表格中数据如下图
使用pd.read_excel()导入变成了,如下:
出现数据导入不全的情况,
上网找了很多 都没有找到如何解决
最后发现问题可能出在读取Excel文件时的参数设置上。默认情况下,Pandas会将Excel表格的第一行作为列名,而将其余的行作为数据。如果第一行存在连续相同的值,可能会导致数据显示为空值。
所以将
titanic=pd.read_excel(r'文件.xlsx') X = titanic.drop(['y'], axis = 1) y = titanic.y print(titanic) print(X)
改为
titanic = pd.read_excel(r文件.xlsx', header=None) X = titanic.iloc[1:, :-1] # 排除第一列作为索引,排除最后一列作为目标变量 y = titanic.iloc[1:, -1] # 最后一列作为目标变量 y = y.astype(int)
得到解决
最后输出
print(titanic) print(X)
得到