做线性回归的时候,出现如下错误:
ValueError:Input contains NaN, infinity or a value too large for dtype(‘float64’)
检查了dataframe发现数据带有NaN,最后一步一步调试,发现问题出现在下面这行代码上:
pd.concat([data,pd.Series(is_outline,name='IsOutline')],axis=1)
由于data是之前dataframe洗牌后取的样本,所以索引上出现乱序,与pd.Series的索引顺序不一致,因此出现NaN。解决的办法是:在代码的前面增加一句代码,将乱序的索引进行重排序。如下:
data = data.reset_index(drop=True)
`