Pandas常用命令

1. 数据读取与写入

  • 读取CSV文件pd.read_csv(filename)
  • 读取Excel文件pd.read_excel(filename)
  • 读取SQL数据库pd.read_sql(query, connection_object)
  • 写入CSV文件df.to_csv(filename, index=False)
  • 写入Excel文件df.to_excel(filename, sheet_name='Sheet1', index=False)

2. 数据查看

  • 查看前几行数据df.head(n),默认显示前5行
  • 查看后几行数据df.tail(n),默认显示后5行
  • 查看数据维度df.shape,返回行数和列数的元组
  • 查看数据集基本信息df.info(),包括索引、列名、数据类型和内存信息
  • 查看数值型列的统计信息df.describe()

3. 数据筛选与索引

  • 按列名访问数据df['col_name']
  • 按位置访问数据df.iloc[row_index, column_index]
  • 按索引名访问数据df.loc[index_name, 'col_name']
  • 条件筛选df[df['col_name'] > threshold]
  • 多条件筛选:使用&|等逻辑运算符

4. 数据处理

  • 检查缺失值df.isnull() 或 df.isna()
  • 删除缺失值df.dropna()(按行删除)、df.dropna(axis=1)(按列删除)
  • 填充缺失值df.fillna(value=x)x为填充值
  • 数据类型转换df['col_name'].astype(float)
  • 字符串替换df['col_name'].str.replace('old_str', 'new_str')

5. 数据排序与分组

  • 按索引排序df.sort_index()
  • 按列值排序df.sort_values(by='col_name', ascending=True/False)
  • 数据分组df.groupby('col_name'),之后可以接agg()transform()等函数进行聚合操作

6. 数据转换与合并

  • 重置索引df.reset_index(),可选参数drop=True用于不将旧索引作为列保留
  • 设置索引df.set_index('col_name')
  • 合并DataFramepd.concat([df1, df2], axis=0/1)axis=0表示纵向合并,axis=1表示横向合并
  • 连接DataFramepd.merge(df1, df2, on='col_name'),根据指定列连接两个DataFrame

7. 统计与计算

  • 求最大值df.max()
  • 求最小值df.min()
  • 求和df.sum()
  • 求平均值df.mean()
  • 唯一值计数df['col_name'].nunique() 或 df['col_name'].value_counts()

8. 其他常用命令

  • 重命名列df.rename(columns={'old_name': 'new_name'})
  • 增加列df['new_col'] = df['existing_col'] + 1
  • 删除列df.drop('col_name', axis=1)
  • 删除行df.drop(index_name, axis=0)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值