在处理数据分析和数据处理任务中,经常需要从DataFrame中提取特定的列数据进行进一步分析或处理。下面将介绍针对DataFrame提取特定列数据的三种常用方法,分别是使用列名、使用列索引和使用loc方法。
方法一:使用列名
DataFrame通常由多个列组成,每个列都具有唯一的列名。要提取特定列的数据,可以使用列名作为索引。
示例代码:
import pandas as pd
# 创建示例DataFrame
data = {'姓名': ['小明', '小红', '小刚'],
'年龄': [18, 20, 22],
'性别': ['男', '女', '男']}
df = pd.DataFrame(data)
# 提取“年龄”列数据
age_column = df['年龄']
print(age_column)
输出结果:
0 18
1 20
2 22
Name: 年龄, dtype: int64
方法二:使用列索引
除了使用列名,还可以使用列的索引来提取特定列的数据。DataFrame的列索引是从0开始的整数。
示例代码:
import pandas as pd