AI课堂Pandas学习总结

一、Pandas简介

        Pandas是一个强大的Python数据分析库,它提供了快速、灵活和易于理解的数据结构,旨在使“数据清洗”和“数据分析”工作变得更加轻松。它是基于NumPy(一个用于数值计算的Python库)构建的,并支持大量不同的数据输入/输出格式。
 

二、Pandas的数据结构

        Series:一维数组,与NumPy的ndarray类似,但包含了标签,即索引(index)。

        DataFrame:二维表格型数据结构,包含了行标签(index)和列标签(columns)。

        Panel:三维数组,可以理解为多个DataFrame的组合。

三、Pandas的基本操作
        

        导入Pandas:import pandas as pd

        创建 Series:s = pd.Series(data, index=index)

        创建 DataFrame:df = pd.DataFrame(data, index=index, columns=columns)

        访问数据:df.head() # 显示前几行数据,df.tail() # 显示后几行数据,df.shape # 显示数据形   状,df.dtypes # 显示每列的数据类型,df.describe() # 显示数据的统计描述

        数据筛选:df[column_name] # 筛选某一列,df[df['column_name'] > value] # 筛选满足           的行

        数据修改:df['new_column'] = data # 增加新列,df['column'] = df['column'].fillna(value) # 填充缺失值

        数据排序:df.sort_values('column', ascending=True) # 按某一列排序

        数据分组:grouped = df.groupby('column') # 按某一列进行分组,grouped.mean() # 计算每组数据的平均值

四、Pandas的数据输入/输出     

        CSV:read_csv(), to_csv()

        Excel:read_excel(), to_excel()

        SQL:read_sql(), to_sql()

        JSON:read_json(), to_json()

五、总结

        Pandas是一个功能强大的数据处理工具,掌握其基本用法对于数据进行清洗和分析是非常重要的。本文只是简单介绍了Pandas的一些基础操作,实际上,Pandas的功能远不止这些,还有更多高级的使用方法等待我们去探索和学习。

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值