[python][代码]Python中操作DataFrame的常用方法

Python 中操作 DataFrame 的常用方法主要依赖于 pandas 库,这是一个功能强大的数据分析工具。以下是一些基本和常用的 DataFrame 操作方法:

1. 创建 DataFrame:
python
import pandas as pd
data = {'Column1': [1, 2, 3], 'Column2': ['a', 'b', 'c']}
df = pd.DataFrame(data)
2.查看 DataFrame:

    df.head(n): 查看前 n 行,默认为 5 行。

    df.tail(n): 查看后 n 行,默认为 5 行。

3.选择数据:

    通过列名选择列:df['Column1']

    通过列索引选择列:df.iloc[:, 0]

    通过条件选择行:df[df['Column1'] > 1]

4.数据过滤:

    使用布尔索引:df[df['Column1'] == 2]

5.添加列:

    df['NewColumn'] = [4, 5, 6]

6.修改列名:

    单个列名:df.rename(columns={'OldName': 'NewName'})

    多个列名:df.columns = ['NewName1', 'NewName2', ...]

7.删除列:

    df.drop('Column1', axis=1, inplace=True)

8.排序:

    df.sort_values(by='Column1')

    df.sort_index()

9.聚合和统计:

    df.mean(): 计算均值

    df.sum(): 求和

    df.max(): 求最大值

    df.min(): 求最小值

10.分组:

    grouped = df.groupby('Column1')

11.合并 DataFrame:

    纵向合并:pd.concat([df1, df2])

    横向合并:df1.merge(df2, on='key_column')

12.数据类型转换:

    df['Column1'] = df['Column1'].astype(int)

13.缺失数据处理:

    删除缺失值:df.dropna()

    填充缺失值:df.fillna(value)

14.数据重塑:

    透视表:pd.pivot_table(df, values='Column1', index='Column2', columns='Column3', aggfunc='mean')

    堆叠/解堆叠:df.stack() / df.unstack()

15.保存和读取数据:

    保存到 CSV:df.to_csv('filename.csv', index=False)

    读取 CSV:pd.read_csv('filename.csv')

这些只是 pandas 中 DataFrame 操作的一部分常用方法。根据你的具体需求,pandas 库提供了更多的功能和方法。

  • 12
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

awonw

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值