在学习机器学习的过程
由于书本使用的PNADAS版本较老,于是便会出现同样的代码却会报错或者WARNING的问题。
这里用于记载我所遇到的一些问题和解决办法
遇到的第一个问题如下:
在对我的训练集进行特征赋值的时候,书本的代码如下:
X_train = train[selected_features]
在这里是将train这整个训练集中的特征提取后传给X_train,没有出现报错
而在进行如下操作(将Embarked列中缺失的数据填充)后,出现WARNING
X_train['Embarked'].fillna('S',inplace=True)
这里的warning如下:
SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
大意是指这个操作所填充的地方是在train这个DataFrame的一个副本之下进行的
代码可以执行,但出现警告的话,总归是有潜在风险的。
简单的解决办法是,直接为X_train创建一个新的特征提取后的Dataframe,如下操作:
X_train = train[selected_features]
变为
X_train = DataFrame(train[selected_features])
这里的X_train将被创建为一个全新的Dataframe, 不会再与train有任何关联。
应该就避免了一些潜在的操作风险。