python中pandas库,浅谈python的第三方库——pandas(一)

pandas作为python进行数据分析的常用第三方库,它是基于numpy创建的,使得运用numpy的程序也能更好地使用pandas。

1 pandas数据结构

1.1 Series

注:由于pandas与numpy关系密切,所以在代码中经常将二者一同导入使用。

d2dd4a284c8f0aace83c4cfa0739e658.png

上图中,先利用numpy创建一个一维数组,再利用pandas的内置方法将其转换为pandas的序列类型Series。可以看到,pandas会自动将原有数据转换成一列,并添加行的索引。

1.2 DataFrame

pandas的第二种也是最具代表性的数据结构就是DataFrame。

a2f92c27e927cfdec0a471d82e22205c.png

显然,DataFrame就是矩阵类型的数据,只不过pandas中会给矩阵添加行列索引,以便使用与查找元素。

2 创建DataFrame

由于Series可以视为DataFrame的一种简单情况,所以后面将主要介绍DataFrame,关于Series的情况可以类比过去。

从前一小节可以看到,pandas的数据可以通过运用内置方法转换numpy创建的数据得到,但也可以直接在pandas库内创建DataFrame。

e1d40941202ff145911ef50223d99c24.png

创建DataFrame时,可以手动给数据添加行列名,否则pandas会自动添加形如“0,1,2,3”的行列名。

由于pandas基于numpy制作,所以numpy中的一些常用方法可以直接移植过来。

f9f316a8d9bf0ef4d221c1575bb65760.png

pandas中也有shape方法查看矩阵大小。

3 查找DataFrame的元素

因为pandas中的矩阵允许自定义行列名,所以定位其中的元素分为如下几种方式:使用行列名称,使用行列位置,名称位置混合。

3.1 行列名称定位

bb5bcfcf2e2074acb8c8bd71f5988c4e.png

3.2 行列位置定位

422ade9605e542fc1bdabb7a6b2f313c.png

3.3 名称位置混合定位

adf1a4b5a57fa80dffc6a80d06e812b5.png

一般常用的还是前两种定位手段,混合定位了解即可。

小结:作为pandas系列的开篇,本文就介绍到此,沿用numpy系列的模式,后面的博文将介绍pandas中关于DataFrame的常用方法。

原文链接:https://www.cnblogs.com/pythonfl/p/12272541.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值