Pandas Dataframe中diff()函数进行一阶差分操作的详解--使用实例解释diff差分操作
diff函数是从数学上来说,是将数据与平移后的数据进行比较得出的差异数据。从操作的意义上来说,是两条临近记录的差值,也就是一阶差分。下面用举例子的方式,将diff的功能进行阐述:
现在有一个DataFrame类型的数据df,如下:
现在对df进行一阶差分操作:df.diff(),得到结果:
这个操作实际等效于:df - df.shift(1)
df.shift(1)是将df在纵轴上向下平移一次,即df.shitf(1)为:
现在看一下:df - df.shift(1)是否与df.diff()相同,答案是肯定的。
函数的完整参数为:DataFrame.diff(periods=1, axis=0)。其中axis 表示纵轴还是横轴,periods表示平移的条目数。
现在看一下:diff.shift(axis=1):
df.diff(periods = 2)的效果如下: