Pandas基础1：数据类型

最新推荐文章于 2021-11-20 10:00:00 发布

Esun_nyy

最新推荐文章于 2021-11-20 10:00:00 发布

阅读量240

点赞数

分类专栏：数据基础文章标签： pandas python

本文链接：https://blog.csdn.net/weixin_46020624/article/details/114307590

版权

基础同时被 2 个专栏收录

46 篇文章 0 订阅

订阅专栏

数据

24 篇文章 1 订阅

订阅专栏

Pandas

Pandas基础1：数据类型

一、Series

一维数组，由key（相关的数据索引标签），和values（一组数据ndarray）组成
可以把Series看成一个定长的有序字典

创建

由列表或numpy数组创建，默认索引为0到n-1的整数型索引
由numpy数组创建时，Series对象指向原来numpy数组的地址
index指定索引
name指定名称
copy新建地址

pd.Series(data=[1, 2, 3, 4, 5], index=list('abcde'), name='名称', copy=False)

由字典创建
字典的key自动变成索引

pd.Series(dict(a=1, b=2, c=3))

索引

枚举型索引：特征索引是连续数值
关联型索引：特征索引都是离散字符类型
显式索引：使用index中的关联类型作为索引值，使用.loc[ ]（推荐）
隐式索引：使用整数作为索引值，使用.iloc[ ]（推荐）

s = pd.Series(dict(a=1,b=2,c=3,d=4))
s['a'], s[1], s.c
s.loc['a'],s.iloc[1]

$\Rightarrow$ 1,2,3
$\Rightarrow$ 1,2

切片

s[0:-1]
s['a':'d']
s.loc['a':'d']  # 显式切片
s.iloc[0:-1]  # 隐式切片

$\Rightarrow$ 1,2,3,4

属性方法

ndim维度
shape形状
size尺寸
dtype数据类型
index索引
keys()键（索引）
values值
nbytes大小
head()快速查看
tail()快速查看

二、DataFrame

DataFrame是一个【表格型】的数据结构，可以看做是【由Series组成的字典】（共用同一个索引）。
DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到多维。
DataFrame既有行索引，也有列索引,，可以看成二维的Series
行索引：index
列索引：columns
值：values（numpy的二维数组）

创建

由numpy数组创建

pd.DataFrame(data=np.random.randint(1,20,(5,4)) ,index=['a','b','c','d','e'] ,columns=list('ABCD'))

由字典列表创建
字典的key自动变成列索引：columns

pd.DataFrame(data=[{'a': 1, 'b': 2, 'c': 3}, {'a': 1, 'd': 2, 'c': 3}, {'a': 2, 'b': 3, 'c': 4}])

索引

对列进行索引

通过类似字典的方式
通过属性的方式
可以将DataFrame的列获取为一个Series。返回的Series拥有原DataFrame相同的索引，且name属性也已经设置好了，就是相应的列名。

data = pd.DataFrame(data=np.random.randint(1,20,(5,4)) ,index=['a','b','c','d','e'] ,columns=list('ABCD'))
data['A']，data.A

DataFrame的中括号，只能获取列索引。

对行进行索引

使用.loc[ ]加index来进行行索引
使用.iloc[ ]加整数来进行行索引
同样返回一个Series，index为原来的columns。

data.loc['a'].B, data.T.a.B

对元素索引的方法

使用列索引
使用行索引(iloc[3,1]相当于两个参数;iloc[[3,3]] 里面的[3,3]看做一个参数)
使用values属性（二维numpy数组）

data.iloc[0,0]

切片

显式切片iloc

data.loc['a':'e', '2':]

隐式切片iloc

data.iloc[0:-1,2:]

属性方法

基本继承Series的属性

index行索引
columns列索引
ndim维度
shape形状
size尺寸
dtype数据类型
keys()键（索引）
values值
nbytes大小
head()快速查看
tail()快速查看
info()信息大小

Esun_nyy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Pandas基础1：数据类型

PandasPandas基础1：数据类型一、Series一维数组，由key（相关的数据索引标签），和values（一组数据ndarray）组成可以把Series看成一个定长的有序字典创建方式由列表或numpy数组创建，默认索引为0到n-1的整数型索引由numpy数组创建时，Series对象指向原来numpy数组的地址index指定索引name指定名称copy新建地址pd.Series(data=[1, 2, 3, 4, 5], index=list('abcde'), nam
复制链接

扫一扫