Python——pandas数据分析

一、Pandas

Pandas是一种基于Numpy的开源数据分析工具包,提供了高性能、简单易用的数据结构和数据分析函数。

二、安装与检测

检测

pip show pandas

检测已安装:

8fd303db98a14a9dbe173ddb51c49323.png

 检测出未安装:

pip install pandas

三、Series对象

1、定义与创建

Series对象是一种带有标签数据的一维数组,标签在Pandas中有对应的数据类型“Index”Series类似一维数与字典的结合。

(1)、导入第三方库

c035279b95d849809d463373bebf6751.png

(2)、创建对象

①创建Series对象,默认标签index为0,1,2....也可以自己定义

PS:index参数指定索引

d508cd8fb3994fb8ae26dcf5f9631c7e.png 

②将字符串转换为列表

ff65c89bac6b486d865dd50a6a8f003f.png

③用字典创建Series对象

e1ba93f6d7e84ce490987e88bb07aec8.png

④Index对象常见操作

索引操作、切片操作、交集、并集、交集操作.......

35e4f480b3934a6685dcfc5a64b84d4e.png

2、数据访问

9d2c75c17c724f1a9d1cf16adac1553f.png

①用字典的形式keys()方法访问对象

2015697cbac84b07b33f2e19b1fe1e35.png

②用键值对items()方法访问

1c1e4538e621465ab17b7252ba7f91a4.png

③用位置索引访问数据

ddbb39882b434ff6bb6daef08bde15c8.png

3、常用方法

dc77942c819741d29d449760d282578e.png

①对Series对象排序:对对象标签排序

0fa37baec8d249599d976823cc25a334.png

②对对象值排序,但不改变原对象排序

439c305e33c54a15a8f7bee849ba21e5.png

③对对象值排名

3175de65a83a4396b9a7a98844fb1d8a.png

四、DataFrame对象

1、定义与创建

DataFrame可以看做是一种既有行索引,又有列索引的二维数组,类似于Exce表或关系型数据库中的二维表,是Pandas中最常见的基本结构。

c02577d3e8f748c9a7e4c4b047ff58c7.png

PS:

print(对象):返回在客户端中,不会被覆盖

4b1db9e5c5684ca3986eb202a57ac828.png

直接输出对象,事返回在内存中,会被覆盖

2a8f45038b85484ca4e7f899a7d00ee5.png

2、数据访问

①以列索引为关键字,获取某一列数据

PS:这里s_1没有输出因为被s_2覆盖。

02c7de2b28a24e408686cae25145ee31.png

cec1582605894b94a9c50a9726c2bab5.png

②根据属性索引,无【】

a1958aa0fb39430fa1452410ee7f33aa.png

③根据行列位置访问单个数据

316bfe43a4244686bf30a1580ab0f592.png

④访问多列

3cb713cc25ae405fa274cb4bdb5f7b94.png

⑤显式索引:按键名(列名)访问

efd1c577b8914e3f98c1f60917e07579.png

⑥隐式索引:通过切片按序号访问  

461bb91f488746ac85c9bc1e368bb956.png

⑦根据表达式访问判断返回逻辑值

b29dd8697b914d5992da7488cf07035f.png

3、常见方法

①获取形状信息,结果为一个元组

07e2627529074dae85ba6d36218fb505.png

②获取各字段的数据类型,结果为 Series

6aa0e288586d4df3bf6ac5cdcc694022.png

③获取数据内容,结果通常为二维数组

d48195401f4c42f2872626438df36944.png

④获取列索引,即字段名称,结果为 Index

9b3360288a56458284a886d9ea5f76b3.png

⑤行索引,即行的标签,结果为 Index

07a7a9a8214e4a91a94365a9949cb762.png

⑥同时获取行和列索引,结果为 Index列表

1ebbf7ebf4a343a6881194bc1257a8e5.png

4、常见操作

 

1、使用Pandas读取两个表格数据,并将其根据姓名进行合并

set_index():设置索引列,可以用一个已有列名作为索引,返回新的对象。

skiprows:跳过多少行。

merge():指定相应列的名称进行关联。

join():通过索引将数据合并在一起。

83bb39d2b6dd4a5caf29167ab67e0e8a.png

c2ac6dd1262541a7aa7c890007ba4b2a.png

2、实现按总分或语文、数学、英语单科成绩从高到低排序的功能

sort_values(by):根据值进行排序,可以指定一列或多列,返回新的对象。默认为由低到高(True),用ascending=False ,改为由高到低。

7940415ea322482da59d930fb97f0f04.png

01ee7ea528154cd2bf871dc3a44ee661.png

3、打印所有存在不及格科目(单科<60)的学生记录

4fcb3610d3704d34b81390e1164bdccf.png

66b94522a4974d03a316fb6841a8816e.png

 

  • 8
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值