pandas的数据结构

最新推荐文章于 2022-09-22 11:01:57 发布

KklomF_

最新推荐文章于 2022-09-22 11:01:57 发布

阅读量1.3k

点赞数

文章标签： pandas 数据结构 python

本文链接：https://blog.csdn.net/KklomF_/article/details/125947681

版权

本文介绍了pandas的两个核心数据结构——Series和DataFrame。Series是一种一维数组对象，具有内置索引，可以进行多种数据操作，如改变索引、数据运算和检查缺失值。DataFrame是二维表格型数据结构，允许存储不同类型的列，并提供了如head方法、列的定制排序等功能。文章详细阐述了这两个数据结构的使用方法和操作实例。

摘要由CSDN通过智能技术生成

一、pandas的撒胡菊架构介绍

pandas有两个主要的数据结构：series和dataframe。它们是解决大部分应用可靠、易于使用的基础。

1.1 series

1.1.1series怎么使用？

Series是一种类似于一维数组的对象，它由一组数据（各种NumPy数据类型）以及一组与之相关的数据标签（即索引）组成。仅由一组数据即可产生最简单的Series：
概括： 给定一些数，用series会生成一个索引（排列号），它是从0开始排序。

In [11]: obj = pd.Series([4, 7, -5, 3])

In [12]: obj
Out[12]: 
0    4
1    7
2   -5
3    3
dtype: int64

1.1.2series中对数据的一些操作

1）看看index是啥

我们可以通过series的value和index属性获取其数组表示形式和索引对象

In [13]: obj.values
Out[13]: array([ 4,  7, -5,  3])
# values代表的是这个数组中的数值
In [14]: obj.index  # like range(4)
#index是前面序列号的排序方式和数值
Out[14]: RangeIndex(start=0, stop=4, step=1)

2）怎么改变index对应的形式

我们可以自己来改变数据点的索引

In [15]: obj2 = pd.Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])

In [16]: obj2
Out[16]: 
d    4
b    7
a   -5
c    3
dtype: int64

In [17]: obj2.index
Out[17]: Index(['d', 'b', 'a', 'c'], dtype='object')