Python 数据框基本操作
Python 是一种流行的编程语言,常用于数据分析、数据科学和机器学习等领域。Python 中数据框是一种非常重要的数据类型,也被称为表格或二维数组。本文将介绍 Python 数据框的基本操作。
什么是 Python 数据框?
Python 数据框是一种二维表格数据结构,类似于 Excel 表格或 SQL 数据库表格。数据框由行和列组成,其中每一行代表一个记录或观测值,每一列代表一种变量或属性。Python 数据框支持针对行和列的切片、索引、过滤、排序、聚合等基本操作。
如何创建 Python 数据框?
Python 数据框可以使用多种方式创建,常见的方式包括使用 Pandas 库创建、从 CSV 文件或 SQL 数据库中读取等。下面是一个使用 Pandas 库创建 Python 数据框的示例代码:
import pandas as pd
data = {'Name': ['John', 'Emily', 'Ryan', 'Sarah'],
'Age': [30, 25, 35, 28],
'City': ['New York', 'London', 'Paris', 'Sydney']}
df = pd.DataFrame(data)
print(df)
输出结果为:
Name Age City
0 John 30 New York
1 Emily 25 London
2 Ryan 35 Paris
3 Sarah 28 Sydney
如何索引 Python 数据框?
Python 数据框可以通过行标签或列标签进行索引。使用 loc 方法可以根据行标签和列标签进行索引,使用 iloc 方法可以根据行位置和列位置进行索引。下面是一个索引示例代码:
import pandas as pd
data = {'Name': ['John', 'Emily', 'Ryan', 'Sarah'],
'Age': [