记录一个小bug
Target is out of bound指的是label的类别数不匹配,但我这个错误明显有点离谱,后面检查时发现自己合并DataFrame时弄成按行合并了,label中出现了NaN,最终出现了这个错误
class TitanicDataSet(torch.utils.data.Dataset):
def __init__(self, filepath):
df_data = pd.read_csv(filepath)
df_data.drop(labels=['PassengerId', 'Name', 'Ticket', 'Cabin'], axis=1, inplace=True)
sex = pd.get_dummies(df_data['Sex'], drop_first=True)
df_data.fillna(df_data.mean(), inplace=True)
embarked = pd.get_dummies(df_data['Embarked'], drop_first=True)
df_data.drop(labels=['Sex', 'Embarked'], axis=1, inplace=True)
df_data = pd.concat([df_data, sex, embarked], axis=1)#就是这里出了错,原来这里axis默认为0(按行合并)
print(df_data.head())
self.y_data = torch.autograd.variable(torch.LongTensor(df_data.iloc[:, 0].values))
print(self.y_data)
df_data = pd.DataFrame(scaler1.fit_transform(df_data))
x_data = pd.DataFrame(scaler1.fit_transform(df_data))
self.x_data = torch.autograd.variable(torch.FloatTensor(x_data.iloc[:, 1:].values))
def __getitem__(self, item):
return self.x_data[item, :], self.y_data[item]
def __len__(self):
return self.x_data.shape[0]