1.
apply函数是pandas里面所有函数中自由度最高的函数。该函数如下:
DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)
该函数最有用的是第一个参数,这个参数是函数,相当于C/C++的函数指针。
这个函数需要自己实现,函数的传入参数根据axis来定,比如axis = 1,就会把一行数据作为Series的数据 结构传入给自己实现的函数中,我们在函数中实现对Series不同属性之间的计算,返回一个结果,则apply函数 会自动遍历每一行DataFrame的数据,最后将所有结果组合成一个Series数据结构并返回
2.
fillna()会填充nan数据,返回填充后的结果。如果希望在原DataFrame中修改,则把inplace设置为True
df = pd.DataFrame({'id':[1, 2, nan, 4, nan, 6, 1, 2, 3], 'item1':[1, 2, 3, 4, nan, 6, 1, 2, 3], 'item2':[1, 2, 3, 4, 5, 6, 1, nan, 3]})
print(df)
df.fillna(0, inplace = True)
print(df)