Pandas 常用命令

tag : pandas 常用基础命令

    注:用于记录pandas所有常用的基础命令。

    参考链接:Pandas 数据框增、删、改、查、去重、抽样基本操作:

    # 字段重命名$a 重命名为a  无返回值
    df.rename(columns={'$a': 'a', '$b': 'b'}, inplace=True) 
    # inplace 直接修改,所以无返回值。 inplace=False 不直接修改,故有返回值
    
    # 指定列 填充空值为0
    col = "aaaaa"
    df[col] = df[col].ffill(0)
    
    # pandas列函数处理 -- 整列每行采用同一个函数处理
    c=c[["a","b"]].apply(foo,axis=1)
    
    # 获取指定字段长度大于10的数据 .map(len)
    df = df[df['JY_FROM_NAME'].map(len) >= 10]
    
    # 数据去重 
    drop_duplicates df = df.drop_duplicates()
    
    # 数据合并 concat
    df_new = pd.concat([df1,df2])
    
    # 数据汇总 
    groupbygroupby_col = ["a","b","c"]
    sum_col = "amount"
    df_new = df.groupby(groupby_col)[[sum_col]].sum()
    
    # 查看开头为xxx的字符 .str.startswith('0')
    df["JY_FROM_CERTID"] = df[df["JY_FROM_CERTID"].str.startswith('0')]
    
    # 去除指定左边开头的字符 str.lstrip("9")
    df["JY_FROM_CERTID"] =  df["JY_FROM_CERTID"].str.lstrip("9")
    
    # pandas 列类型转换为 日期格式
    # 方法1
    df['date'] = pd.to_datetime(df['date'])
    df.set_index("date", inplace=True) # 方法2
    df2.index = pd.DatetimeIndex(df2["date"])
    del df2["date"]
    结论:.to_datetime仅转换格式,.DatetimeIndex还能设置为索引
    
    # pandas类型种类 str float int datetime
    df[col] = df[col].astype('str')
    
    # DataFrame 转 list
    np.array(data_x).tolist()
    
    # pandas 行列循环
    df.iterrows()
    
    # 删除全空的那列
    df = df.dropna(axis=1,how='all')
    
    # axis参数说明
    axis = 1 行处理 默认
    axis = 1 列处理
    
    # 删除含有空数据的全部行 
    df4 = pd.read_csv('4.csv', encoding='utf-8')
    df4 = df4.dropna() 
    # 可以通过axis参数来删除含有空数据的全部列 
    df4 = df4.dropna(axis=1) 
    # 可以通过subset参数来删除在age和sex中含有空数据的全部行 
    df4 = df4.dropna(subset=["age","sex"])
    
    
    
    
    • 0
      点赞
    • 3
      收藏
      觉得还不错? 一键收藏
    • 打赏
      打赏
    • 0
      评论
    PandasPython中一个强大的数据处理库,它提供了一个灵活的数据结构DataFrame,用于数据清洗、转换、分析等操作。以下是一些常用Pandas命令: 1. **数据读取**: - `pd.read_csv(file_path)`:从CSV文件读取数据。 - `pd.read_excel(file_path)`:读取Excel文件。 - `pd.read_sql_query(sql, con)`:从SQL数据库查询数据。 2. **创建DataFrame**: - `pd.DataFrame(data, index=None, columns=None)`:根据数据创建DataFrame。 - `pd.DataFrame({'column1': data1, 'column2': data2}, index=...)`:指定列和索引。 3. **查看数据**: - `df.head()`:显示数据框的前几行。 - `df.tail()`:显示数据框的后几行。 - `df.info()`:显示数据的基本信息,包括每列的非空值数量等。 4. **数据清洗**: - `df.dropna()`:删除含有缺失值的行或列。 - `df.fillna(value)`:填充缺失值。 - `df.replace(to_replace, value)`:替换特定值。 5. **数据选择与切片**: - `df['column_name']`:选择单列数据。 - `df.iloc[row_index, column_index]`:按位置选择元素。 - `df.loc[row_label, column_label]`:按标签选择元素。 6. **数据操作**: - `df.groupby('column')`:按列分组。 - `df.merge(df2, on='key', how='inner')`:合并数据。 - `df.sort_values(by='column')`:按某列排序。 7. **数据统计**: - `df.describe()`:计算各数值列的统计摘要。 - `df.sum()`, `df.mean()`, `df.min()`, `df.max()`:计算各类统计量。 8. **数据透视表**: - `df.pivot_table(values='value_column', index='index_column', columns='column_column')`:创建数据透视表。

    “相关推荐”对你有帮助么?

    • 非常没帮助
    • 没帮助
    • 一般
    • 有帮助
    • 非常有帮助
    提交
    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包

    打赏作者

    SuperScfan

    多谢您的支持O(∩_∩)O~~

    ¥1 ¥2 ¥4 ¥6 ¥10 ¥20
    扫码支付:¥1
    获取中
    扫码支付

    您的余额不足,请更换扫码支付或充值

    打赏作者

    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值