diff函数是用来将数据进行某种移动之后与原数据进行比较得出的差异数据,举个例子,现在有一个DataFrame类型的数据df,如下:
index | value1 |
---|---|
A | 0 |
B | 1 |
C | 2 |
D | 3 |
如果执行:
df.diff()
则会得到:
index | value1 |
---|---|
A | NaN |
B | 1 |
C | 1 |
D | 1 |
怎么得到的呢,其实是经过了两个步骤,首先会执行:
df.shift()
然后再将该数据与原数据做差,即:
df.shift()-df
函数原型:
DataFrame.diff(periods=1, axis=0)
参数:
periods:移动的幅度,int类型,默认值为1。
axis:移动的方向,{0 or ‘index’, 1 or ‘columns’},如果为0或者’index’,则上下移动,如果为1或者’columns’,则左右移动。
返回值
diffed:DataFrame类型
例如:执行
df.diff(2)
得到:
index | value1 |
---|---|
A | NaN |
B | NaN |
C | 2 |
D | 2 |
执行
df.diff(-1)
得到:
index | value1 |
---|---|
A | -1 |
B | -1 |
C | -1 |
D | NaN |