在 Python 中,pandas.DataFrame
是一个非常强大的数据结构,用于表示表格、多维数组或异质型数据表。这是 pandas 库中最常用的对象之一,广泛应用于数据分析、数据清洗、数据转换及统计建模等任务。
基本特征
- 二维大小可变:DataFrame 可以修改大小,且可以修改其行索引和列标签。
- 异质型:每一列可以是不同的数据类型(数值、字符串、布尔值等)。
- 标签轴:数据操作时行和列都可以通过标签进行操作。
- 可以进行算术运算:具有灵活的工具进行算术运算和自动数据对齐。
创建 DataFrame
DataFrame 可以通过多种方式创建,例如从列表、字典、读取文件等:
1. 从列表创建
import pandas as pd
data = [
[1, 'Alice', 22],
[2, 'Bob', 27],
[3, 'Chris', 25]
]
df = pd.DataFrame(data, columns=['ID', 'Name'