使用 Pandas 的 assign
方法是一种方便的方式在 DataFrame 中添加新列。assign
方法允许你链式调用,将新列添加到 DataFrame 中,而不会改变原始 DataFrame。以下是一个简单的例子:
import pandas as pd
# 创建一个示例 DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
# 使用 assign 方法添加新列
df = df.assign(NewColumn=[1, 2, 3])
# 打印 DataFrame
print(df)
在这个例子中,我们创建了一个包含 ‘Name’ 和 ‘Age’ 列的 DataFrame,然后使用 assign
方法添加了一个名为 ‘NewColumn’ 的新列。输出将是:
Name Age NewColumn
0 Alice 25 1
1 Bob 30 2
2 Charlie 35 3
你还可以使用现有列的值计算新列的值。例如:
# 使用 assign 方法计算新列的值
df = df.assign(DoubleAge=df['Age'] * 2)
# 打印 DataFrame
print(df)
这将添加一个名为 ‘DoubleAge’ 的新列,其值是 ‘Age’ 列的两倍:
Name Age NewColumn DoubleAge
0 Alice 25 1 50
1 Bob 30 2 60
2 Charlie 35 3 70
需要注意的是,assign
方法返回一个新的 DataFrame,因此如果你想要保留更改,你需要将结果赋值给原始 DataFrame(df
)。
这种方法是在不修改原始数据的情况下进行操作的一种便捷方式。