OpenSNN开思通智网,官网地址:https://w3.opensnn.com/
2024年8月份 “O站创作者招募计划”
快来O站写文章,千元大奖等你来拿!
“一起来O站,玩转AGI!”
pandas
主要用于数据分析,常用于处理结构化数据,如表格数据。下面是 pandas
的简单使用。
1. 导入 pandas
包
首先,你需要导入 pandas
包:
import pandas as pd
2. 创建 DataFrame
DataFrame
是 pandas
的核心数据结构,类似于电子表格中的表格。你可以从字典、列表等数据结构创建一个 DataFrame
:
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago
3. 读取数据
你可以使用 pandas
读取各种格式的文件,比如 CSV 文件:
df = pd.read_csv('file.csv')
4. 数据选择与过滤
pandas
提供了多种方法来选择和过滤数据:
- 选择列:
print(df['Name'])
- 选择行:
print(df.iloc[0]) # 选择第一行
- 基于条件过滤数据:
print(df[df['Age'] > 30]) # 选择年龄大于30的数据
5. 数据统计与分析
pandas
具有强大的数据统计功能:
print(df.describe()) # 生成数据的统计信息
6. 数据清洗
你可以轻松处理缺失数据:
df.dropna() # 删除包含缺失值的行
df.fillna(0) # 用0填充缺失值
7. 数据分组
你可以根据某列的值对数据进行分组:
grouped = df.groupby('City').mean()
print(grouped)
8. 导出数据
你可以将 DataFrame
导出为 CSV 等格式:
df.to_csv('output.csv', index=False)
这是 pandas
基本用法的一些示例。pandas 是 Python 中一个非常强大的数据分析库,可以用来进行数据处理、分析和可视化。
【转载自:】OpenSNN开思通智网 ---- “一起来O站,玩转AGI!”
【官网:】https://w3.opensnn.com/
【原文链接:】https://w3.opensnn.com/os/article/10001299