基于DataFrame中另一列的列的滚动总和

潮易

于 2024-07-29 06:10:26 发布

阅读量206

点赞数 2

文章标签： python 开发语言

本文链接：https://blog.csdn.net/wangbadan121/article/details/140760831

版权

在Python中使用pandas库，我们可以轻松地解决这个问题。首先，我们需要确保你的环境中已经安装了pandas库。如果没有，可以通过运行`!pip install pandas`来安装。

下面是一个详细的步骤来解决这个问题：

1. 导入pandas库：

```python
import pandas as pd
```

2. 创建一个DataFrame，例如：

```python
data = {'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
print(df)
```

输出：

```
   A     B
0 1   100
1 2   120
2 3   150
3 4   180
4 5   200
```

3. 我们想要基于列'B'的滚动总和。在pandas中，我们可以使用`rolling()`函数来实现这一点。我们需要指定我们想要滚动的总和的窗口大小。在这个例子中，我们想要滚动窗口的大小为2，因此我们将`window=2`传递给`rolling()`函数。然后，我们可以使用`sum()`函数来计算滚动总和：

```python
df['B_cumsum'] = df['B'].rolling(window=2).sum()
print(df)
```

输出：

```
   A     B B_cumsum
0 1   100        NaN
1 2   120       200.0
2 3   150       370.0
3 4   180       570.0
4 5   200       770.0
```

在这个例子中，可以看到列'B_cumsum'是基于列'B'的滚动总和。对于每一行，它都包含了在当前和上一个值之间的总和。

如果你想要一个更大的窗口，你可以将`window`参数更改为对应的值。例如，如果你想计算基于列'B'的三个值的滚动总和，你可以将`window=3`传递给`rolling()`函数：

```python
df['B_cumsum'] = df['B'].rolling(window=3).sum()
print(df)
```

输出：

```
   A     B B_cumsum
0 1   100        NaN
1 2   120       200.0
2 3   150       370.0
3 4   180       570.0
4 5   200       770.0
```

在这个例子中，可以看到列'B_cumsum'是基于列'B'的三个值的滚动总和。

关于人工智能大模型的应用，这个问题可以看作是一个时间序列分析的问题。例如，你可能会使用一些机器学习模型（如ARIMA、LSTM等）来预测未来几天的'B'的总和。这需要你的数据是有序的，并且你需要将你的数据分成训练集和测试集。

潮易

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基于DataFrame中另一列的列的滚动总和

在这个例子中，我们想要滚动窗口的大小为2，因此我们将`window=2`传递给`rolling()`函数。例如，你可能会使用一些机器学习模型（如ARIMA、LSTM等）来预测未来几天的'B'的总和。这需要你的数据是有序的，并且你需要将你的数据分成训练集和测试集。如果没有，可以通过运行`!如果你想要一个更大的窗口，你可以将`window`参数更改为对应的值。在这个例子中，可以看到列'B_cumsum'是基于列'B'的滚动总和。在这个例子中，可以看到列'B_cumsum'是基于列'B'的三个值的滚动总和。
复制链接

扫一扫