我正在尝试在SPSS中创建运行总计.此外,我需要多个.我的SPSS数据集看起来像这样(除了运行总数):
> [x] | [y] | [运行总计]
> 10 | 1 | 10(= 0 10)
> 20 | 1 | 30(= 10 20)
> 30 | 2 | 30(= 0 30)
> 40 | 2 | 70(= 30 40)
> 50 | 3 | 50 …
对于每个y值(组ID),我想创建一个运行总计.我能够在整个数据集中创建运行总计,但这不是我所需要的.我需要这样的东西:
对于y = 1至500
计算x = x滞后(x)
可悲的是,SPSS无法在循环中执行x = x lag(x).我需要使用SPSS语法(或Python)来完成此操作,否则,即使有很多数据,我还是会在Excel中手动执行.我非常沮丧,非常感谢您的帮助!
解决方法:
您可以在id变量上使用SPLIT FILE,然后使用CREATE计算ID内的累计和.
SPLIT FILE BY ID.
CREATE /RunTotal=CSUM(X).
SPLIT FILE OFF.
标签:spss,running-total,python