python数据分页pandas,Python数据分析[3] - Pandas包

本文介绍了Python数据分析库Pandas的基础知识,包括Series和DataFrame两种主要数据结构的创建、操作和查询方法。通过实例展示了如何利用Pandas进行数据分页、计算以及处理缺失值,并演示了如何应用函数进行统计分析。
摘要由CSDN通过智能技术生成

Series

Series是一个一维的向量,每个值都会有对应标签,该标签我们称之为Index

Obj = Series([4, 5, -7, 8])

Obj

Out[5]:

0 4

1 5

2 -7

3 8

dtype: int64

Obj2 = Series([4, 5, -7, 8], index = ['a', 'b', 'c', 'd'])

Obj2

Out[7]:

a 4

b 5

c -7

d 8

dtype: int64

通过Index可以对Series进行查询以及修改

Obj2['a']

Out[12]: 4

Obj2['a'] = 0

Obj2

Out[14]:

a 0

b 5

c -7

d 8

dtype: int64

Numpy函数,以及其他类Numpy的向量计算函数,可以应用在Series中,与Numpy的ndarrays基本相同

Obj * 2

Out[16]:

0 8

1 10

2 -14

3 16

dtype: int64

python的dict数据可以直接转换为Series

sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}

obj3 = pd.Series(sdata)

obj3

Out[17]:

Ohio 35000

Texas 71000

Oregon 16000

Utah 5000

dtype: int64

DataFrame

DataFrame是我作为数据分析师,最为常用的一个数据类型。DataFrame代表了一个长方形的表,包含了任意的长度及宽度(可以理解为在Excel中的一个表)。DataFrame拥有Column Index和Row Index(行标与列标)。

最常见的创建DataFrame的方法为从一个包含了Numpy arrays的dict数据转换

data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', '

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值