Pandas 是一个强大的 Python 数据处理和分析库,它提供了高效的数据结构和函数,用于清洗、操作和分析数据。以下是 Pandas 的常用方法及详细说明。
1. 安装和导入 Pandas
安装 Pandas:
pip install pandas
导入 Pandas:
import pandas as pd
2. 数据结构
2.1 Series(序列)
Series 是一维数据结构,类似于带标签的数组。
# 创建 Series
s = pd.Series([10, 20, 30, 40], index=['a', 'b', 'c', 'd'])
print(s)
输出结果
a 10
b 20
c 30
d 40
dtype: int64
2.2 DataFrame(数据框)
DataFrame 是二维数据结构,类似于表格。
# 创建 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'gender': ['F', 'M', 'M'],
'city': ['New York', "San Francisco", "Los Angeles"]}
df = pd.DataFrame(data)
print(df)
输出结果
name age gender city
0 Alice 25 F New York
1 Bob 30 M San Francisco
2 Charlie 35 M Los Angeles