python数据分页pandas,Python数据分析[3] - Pandas包

最新推荐文章于 2023-01-07 17:32:14 发布

管财牛

最新推荐文章于 2023-01-07 17:32:14 发布

阅读量582

点赞数

文章标签： python数据分页pandas

本文介绍了Python数据分析库Pandas的基础知识，包括Series和DataFrame两种主要数据结构的创建、操作和查询方法。通过实例展示了如何利用Pandas进行数据分页、计算以及处理缺失值，并演示了如何应用函数进行统计分析。

摘要由CSDN通过智能技术生成

Series

Series是一个一维的向量，每个值都会有对应标签，该标签我们称之为Index

Obj = Series([4, 5, -7, 8])

Obj

Out[5]:

0 4

1 5

2 -7

3 8

dtype: int64

Obj2 = Series([4, 5, -7, 8], index = ['a', 'b', 'c', 'd'])

Obj2

Out[7]:

a 4

b 5

c -7

d 8

dtype: int64

通过Index可以对Series进行查询以及修改

Obj2['a']

Out[12]: 4

Obj2['a'] = 0

Obj2

Out[14]:

a 0

b 5

c -7

d 8

dtype: int64

Numpy函数，以及其他类Numpy的向量计算函数，可以应用在Series中，与Numpy的ndarrays基本相同

Obj * 2

Out[16]:

0 8

1 10

2 -14

3 16

dtype: int64

python的dict数据可以直接转换为Series

sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}

obj3 = pd.Series(sdata)

obj3

Out[17]:

Ohio 35000

Texas 71000

Oregon 16000

Utah 5000

dtype: int64

DataFrame

DataFrame是我作为数据分析师，最为常用的一个数据类型。DataFrame代表了一个长方形的表，包含了任意的长度及宽度(可以理解为在Excel中的一个表)。DataFrame拥有Column Index和Row Index(行标与列标)。

最常见的创建DataFrame的方法为从一个包含了Numpy arrays的dict数据转换

data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', '

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。