数据框是一种二维数据结构,其中数据以表格格式存储,以行和列的形式。
它可以可视化为SQL数据表或excel工作表表示形式。可以使用不同的方法删除数据框中的列。
我们将看到pop函数,它将需要删除的列的名称作为参数,并将其删除。
示例import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']),
'ef' : pd.Series([56, 78, 32],index=['a','b','c']),
'gh' : pd.Series([66, 77, 88, 99],index=['a','b','c', 'd']) }
my_df = pd.DataFrame(my_data)print("数据框为:")
print(my_df)
print("使用“pop”函数删除列")
my_df.pop('cd')print(my_df)
输出结果数据框为:
ab cd ef gh
a 1.0 1 56.0 66
b 8.0 2 78.0 77
c 7.0 0 32.0 88
d NaN 9 NaN 99
使用“pop”函数删除列
ab ef gh
a 1.0 56.0 66
b 8.0 78.0 77
c 7.0 32.0 88
d NaN NaN 99
说明导入所需的库,并为其指定别名,以方便使用。
创建由键和值组成的字典值,其中值实际上是序列数据结构。
该字典随后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数
“弹出”功能用于删除特定的列。
需要删除的列的名称作为参数传递给'pop'函数。
新的数据框将打印在控制台上。
注意-“ NaN”一词指的是“不是数字”,这意味着特定的[row,col]值没有任何有效的条目。