pandas常用调用函数总结

Pandas 是一个强大的 Python 数据分析库,它提供了丰富的函数和方法来处理数据。下面将详细介绍 Pandas 中一些常用的函数及其功能。

一、数据读取与写入

  • read_csv():读取 CSV 文件到 DataFrame。
  • to_csv():将 DataFrame 写入 CSV 文件。
  • read_excel():读取 Excel 文件到 DataFrame。
  • to_excel():将 DataFrame 写入 Excel 文件。
  • read_json()to_json():读写 JSON 格式数据。
  • read_html()to_html():从网页中读取 HTML 表格数据,以及将数据导出为 HTML 表格。
  • read_clipboard()to_clipboard():从剪贴板读取数据,以及将数据写入剪贴板。

二、数据处理

  • select_dtypes():根据列的数据类型选择数据。
  • dropna():删除包含缺失值的行或列。
  • fillna():填充或替换缺失值。
  • interpolate():对缺失值进行插值处理。
  • duplicated():标记重复的行。
  • drop_duplicates():删除重复的行。
  • str.strip()str.lower()str.upper()str.replace():对字符串类型的列进行清洗,如去除空白字符、转换大小写、替换特定字符等。
  • astype():将一列或多列的数据类型转换为指定类型。
  • sort_values():根据指定列对数据进行排序。
  • rename():对列名或行索引进行重命名。
  • drop():删除指定的列或行。

三、数据聚合与分组

  • groupby():按照指定的列或多个列对数据进行分组。
  • agg():对每个分组应用自定义的聚合函数,如求和、平均值等。
  • transform():对每个分组应用转换函数,返回与原始数据形状相同的结果。
  • sum()mean()median()min()max()std()var():计算分组数据的总和、平均值、中位数、最小值、最大值、标准差和方差。
  • describe():生成分组的描述性统计摘要。
  • nunique():计算分组中唯一值的数量。
  • cumsum()cummin()cummax()cumprod():计算分组的累积和、累积最小值、累积最大值和累积乘积。

四、数据合并与重塑

  • merge():根据指定键关联连接多个 DataFrame,类似 SQL 中的 JOIN。
  • concat():合并多个 DataFrame,类似 SQL 中的 UNION。
  • append():将一行或多行数据追加到 DataFrame 的末尾。
  • pivot()pivot_table():按照指定的行列重塑表格,其中 pivot_table 更加强大,可以计算汇总数据。
  • stack():将数据框的列“堆叠”为一个层次化的 Series。
  • unstack():将层次化的 Series 转换回 DataFrame 形式。

五、数据可视化

Pandas 提供了基础的绘图功能,但更复杂的可视化通常使用 Matplotlib 或 Seaborn 等库。Pandas 的可视化函数包括:

  • plot.area():绘制堆积图。
  • plot.bar():绘制柱状图。
  • plot.barh():绘制水平条形图。
  • plot.box():绘制箱线图。
  • plot.hist():绘制直方图。
  • plot.line():绘制线型图。
  • plot.pie():绘制饼图。
  • plot.scatter():绘制散点图。

六、其他常用函数

  • apply():对数据框的列或行应用函数。
  • applymap():对数据框的每个元素应用函数。
  • isin():判断数据是否在某个集合中。
  • isnull()notnull():检测缺失数据。
  • quantile():计算数据的分位数。
  • reset_index():重置行索引。
  • to_datetime():将输入转换为 Datetime 类型。

这些函数和方法只是 Pandas 强大功能的一部分,Pandas 的设计使得数据处理和分析变得更加简单和高效。在实际应用中,可以根据具体需求选择合适的函数来处理数据。

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值