可以使用 Pandas 的 resample
函数来进行过采样。具体来说,可以先将 label 为 1 的样本进行分组,然后使用 resample
函数进行过采样。例如:
df_majority = df[df['label']==0]
df_minority = df[df['label']==1]
df_minority_upsampled = df_minority.sample(replace=True, n=len(df_majority))
df_upsampled = pd.concat([df_majority, df_minority_upsampled]