在这种情况下,你可以使用下采样来解决这个问题。下采样指的是从原始数据中随机抽取一些数据点,并且在抽取过程中会均衡两个类别的数量。这样可以让你的数据中 0 和 1 的数量接近,从而让模型能够更好地学习。
这是一个使用 Python 和 pandas 实现下采样的例子:
import pandas as pd# 读入数据
df = pd.read_csv('data.csv')
# 计算 0 和 1 的数量
count_0 = df[df['label'] == 0].shape[0]
count_1 = df[df['label'] == 1].shape[0]
# 计算采样