pandas模块学习笔记

最新推荐文章于 2020-10-28 08:04:16 发布

qq_41895704

最新推荐文章于 2020-10-28 08:04:16 发布

阅读量124

点赞数

分类专栏： pandas

本文链接：https://blog.csdn.net/qq_41895704/article/details/101451589

版权

这篇博客介绍了pandas的两种核心数据结构——Series和DataFrame。Series是一维数组，包含索引和值，允许索引重复；DataFrame是二维表格型数据结构，可视为Series的集合，具有列名。博客详细讲解了如何创建Series，包括从数组和字典创建，以及其属性如索引(index)和值(values)。此外，还讨论了Series的获取值方法、数据处理、缺失值检测、自动对齐功能以及Series的name属性。

摘要由CSDN通过智能技术生成

1.pandas基本数据结构

pandas有两种基本的数据结构：Series，DataFrame

1.1：Series：是一种根据一维数组创建的对象，由一为数组和一组索引组成。并且索引值是可以重复的。

1.2：DataFrame：是一个表格型数据结构，一维数组不能够直接使用，需要先将自身利用reshape（-1，1）转变为二维数组方可使用。DataFrame可以看作是Series的聚合体，比起单独的Series多了一个区分的列名。

2.Series使用

2.1 创建

Series可以通过numpy一维数组和普通以为数组创建皆可。

而且还可以通过字典创建，键为索引index，值为values。

Series(np.array([1,2,3,4]))

Series([1,2,3,4])

有两种属性，索引index和值values，还可以使用dtype=设定values的类型。

例如

series=Series（[1,2,3,4],dtype=float64,index=['first','second','third','fourth'])
#也可以在创建对象后再进行修改
series.index=['s','s','s','s']

2.2获取值

可以通过下标和索引两种方式获取索引值

series[0]

series['s&#

最低0.47元/天解锁文章

qq_41895704

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录