Pandas中常用于数据分析的高频函数

一些常用的高频用于数据分析的函数:

  1. 数据结构和基本信息

    • pd.DataFrame():创建数据框。
    • pd.Series():创建系列。
    • df.shape:返回DataFrame的形状。
    • df.columns:返回DataFrame的列名。
    • df.index:返回DataFrame的索引。
  2. 数据查看和切片

    • df.head()df.tail():查看前/后几行数据。
    • df.sample(n):随机抽取n行。
    • df.iloc[]df.loc[]:根据位置或标签选择数据。
    • df['column'].value_counts():计算某列中各个值的频次。
  3. 数据清洗和处理

    • df.drop(labels, axis=, inplace=True):删除行或列。
    • df.fillna(value):填充缺失值。
    • df.replace(old_value, new_value):替换值。
    • df.rename(columns={'old_name': 'new_name'}):重命名列。
    • df.astype(dtype):更改列的数据类型。
  4. 数据计算和统计

    • df.mean()df.median()df.std():计算均值、中位数、标准差等统计量。
    • df.sum()df.min()df.max():计算总和、最小值、最大值等。
    • df.describe():生成描述性统计信息。
    • df.corr():计算列之间的相关性。
  5. 数据合并和连接

    • pd.concat([df1, df2], axis=):沿轴连接数据。
    • pd.merge(df1, df2, on=, how=):合并两个数据框。
    • df.append(df2):在底部追加行。
  6. 数据分组和聚合

    • df.groupby('column').agg({'col1': 'mean', 'col2': 'sum'}):对分组数据进行聚合。
    • df.resample('D').sum():按日期重新采样数据。
  7. 数据绘图和可视化

    • df.plot():绘制数据。
    • sns.heatmap(df.corr(), annot=True, cmap='coolwarm'):绘制相关矩阵热图。
    • sns.boxplot(x='category', y='value', data=df):箱线图。
  8. 时间序列操作

    • pd.to_datetime(df['date_column']):将列转换为日期时间格式。
    • df['date_column'].dt.month:提取日期时间的月份。
    • df.resample('M').sum():按月重新采样时间序列数据。
  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值