Python赋值报错/赋值不了:DataFrame赋值
这次需要通过上下行做差计算一个指标差,并且赋值给新的delta列。以下是可行代码。
for i in range(len(A)):
for j in range(1,len(A[i])):
if A[i].loc[j,'ID']==A[i].loc[j-1,'ID']:
A[i].loc[j,'delta']=A[i].loc[j]['States']-A[i].loc[j-1,'States']
最好的赋值方式,df.loc[行索引,新列名]=……
for i in range(len(A)):
for j in range(1,len(A[i])):
if A[i].loc[j,'ID']==A[i].loc[j-1,'ID']:
A[i]['delta'].loc[j]=A[i].loc[j]['States']-A[i].loc[j-1,'States']
如果是上面这种方式赋值,则会提示delta报错,我认为原因是前面没有定义delta,不可以用这种方式新定义一个列并且赋值。
如果我前面加上了delta,并随便让df[‘delta’]=1,那么上面的代码也是可以的。只不过会出现警告(虽然警告相当于没有,但还是不喜欢警告哈哈哈)(但是得注意一开始定义的会不会给你的结果造成什么影响)
for i in range(len(A)):
for j in range(1,len(A[i])):
if A[i].loc[j,'ID']==A[i].loc[j-1,'ID']:
A[i].loc[j]['delta']=A[i].loc[j]['States']-A[i].loc[j-1,'States']
如果是这样赋值的话,即用loc先索引行,再确定列,虽然不会报错,但这样是赋值不了的。
for i in range(len(A)):
for j in range(1,len(A[i])):
if A[i].loc[j,'ID']==A[i].loc[j-1,'ID']:
A[i]['delta'].iloc[j]=A[i].iloc[j]['States']-A[i].iloc[j-1]['States']
上面是我一开始用得最多得iloc,用来做相对位置的索引,在这次作业里面用它来赋值的时候发现,还是会给delta报错。原因同上面一样,如果一开始定义了delta的话,是可以赋值的。
for i in range(len(A)):
for j in range(1,len(A[i])):
if A[i].loc[j,'ID']==A[i].loc[j-1,'ID']:
A[i].iloc[j]['delta']=A[i].iloc[j]['States']-A[i].iloc[j-1]['States']
如果是这样赋值的话,即用iloc先索引行,再确定列,这样是赋值不了的。
总结:
给新列最好的赋值方式就是用loc的标准形式df.loc[row.column]=……
但是要注意loc的索引是原本的索引,如果前面索引发生了改变,需要用reset_index()
如果不想重新设置索引,可以用df[’’].iloc[]的形式,但是要注意,iloc不能创建新列,必须前面先定义一个列。用这种方法得注意前面定义的列,会不会对你的最终结果产生影响。