问题:
在训练模型 fit(x_train,y_train) 时遇到报错
ValueError: Input contains NaN, infinity or a value too large for dtype('float64')
解决方法:
1、检查数据中是否有缺失值,并做缺失值处理
-
# 读取数据
-
train = pd.read_csv(
'./data/train.csv')
-
-
# 检查数据中是否有缺失值,以下两种方式均可
-
#Flase:对应特征的特征值中无缺失值
-
#True:有缺失值
-
print(train.isnull().any())
-
print(np.isnan(train).any())
-
-
#查看缺失值记录
-
train_null = pd.isnull(train)
-
train_null = train[train_null ==
True]
-
print(train_null)
-
-
#缺失值处理,以下两种方式均可
-
#删除包含缺失值的行
-
train.dropna(inplace=
True)
-
#缺失值填充
-
train.fillna(
'100')
2、检查数据中是否有无穷数据,并做数据处理
-
#检查是否包含无穷数据
-
#False:包含
-
#True:不包含
-
print(np.isfinite(train).all())
-
#False:不包含
-
#True:包含
-
print(np.isinf(train).all())
-
-
#数据处理
-
train_inf = np.isinf(train)
-
train[train_inf] =
0