Python数据分析学习笔记04:Pandas基础

本文详细介绍了Pandas的基础知识,包括Series和DataFrame数据结构,数据导入输出,数据清洗,统计分析,数据合并,以及如何使用SQL方式操作Pandas。重点讨论了数据清洗的技巧,如删除、重命名、去重、格式转换,以及数据统计方法。最后,通过实例展示了如何在Pandas中应用SQL查询。
摘要由CSDN通过智能技术生成

文章目录

一、数据结构:Series和DataFrame

1、Series(序列——一维序列结构)

2、DataFrame(数据帧——二维表结构)

二、数据导入和输出

1、导入excel文件

2、导入csv文件

3、将数据帧导出成excel文件

三、数据清洗

1、删除数据帧中不必要的行或列

2、重命名列名

3、去掉重复的行

4、格式问题

(1)更改数据格式(类型)

(2)大小写转换

(3)数据间的空格

5、查找空值

6、使用apply函数对数据进行清洗

(1)应用系统自带函数

(2)应用自定义函数

7、添加行和添加列

(1)添加新行:Green   89     89    85

(2)在Alice之后插入新行:Brian    56   63   90

(3)添加新列:Average

四、数据统计

1、count()函数

2、describe()函数

3、方差函数var()

4、中位数函数median()

五、数据表合并

1、基于指定列进行连接

2、inner内连接

3、left连接

4、right连接

5、outer外连接

六、如何用SQL方式打开Pandas

1、安装pandasql工具包

2、查询案例演示

(1)查询姓名为Howard的记录

(2)查询语文成绩在80与90之间的记录

(3)将Howard的语文成绩改成99

(4)删除姓名为Howard的记录

七、总结

八、课后练习


在数据分析工作中,Pandas使用频率很高,一方面是因为Pandas提供的基础数据结构DataFrame与JSON契合度高,转换起来挺方便。另一方面,对于不太复杂的日常数据清理工作,通常用几句Pandas代码就可以对数据进行规整。

Pandas是基于NumPy构建的含有更高级数据结构和分析能力的工具包。NumPy中数据结构是围绕ndarray展开的,Pandas的核心数据结构是Series(序列——一维序列结构)和DataFrame(数据帧——二维表结构)。基于这两种数据结构,Pandas可以对数据进行导入、清洗、处理、统计和输出。

一、数据结构:Series和DataFrame

1、Series(序列——一维序列结构)</

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

howard2005

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值