在往Dataframe赋值新列时,常见方法是有两种:
1、df[列名]=Value
2、df.assign(列名=lambda x:…)
但这两种方法都经常会产生如下警告:
SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
产生此警告的原因主要是python的链式赋值(chain)带来的,链式赋值会产生中间变量带来一些问题。具体我就不多解释了,可以参考官方解释。
单值赋给df[列名]的时候,系统会将单值扩展成一个pd.Series并赋值添加到DataFrame中去。而这种扩充产生的临时变量会带来误解,所以系统警告,但仍然处理。
既然问题找到了,那我们处理起来其实也简单,我们自己生成这个pd.Series,然后将其与df合并:
_sProv = pd.Series(data=[_prov] * _dfLastSchs.shape[0], name='省份', index=_dfLastSchs.index)
_prov为单值变量,将其扩展成一个list:
_prov = [_prov] * _dfLastSchs.shape[0]
pd.Series名称,索引使用df的索引。
然后使用join方法,至此,一切完美搞定。
_dfLastSchs = _dfLastSchs.join(_sProv)