Pandas基础1:数据类型

Pandas

Pandas基础1:数据类型


一、Series

  • 一维数组,由key(相关的数据索引标签),和values(一组数据ndarray)组成
  • 可以把Series看成一个定长的有序字典
创建
  • 由列表或numpy数组创建,默认索引为0n-1的整数型索引
  • 由numpy数组创建时,Series对象指向原来numpy数组的地址
  • index指定索引
  • name指定名称
  • copy新建地址
pd.Series(data=[1, 2, 3, 4, 5], index=list('abcde'), name='名称', copy=False)
  • 由字典创建
  • 字典的key自动变成索引
pd.Series(dict(a=1, b=2, c=3))
索引
  • 枚举型索引:特征索引是连续数值
  • 关联型索引:特征索引都是离散字符类型
  • 显式索引:使用index中的关联类型作为索引值,使用.loc[ ](推荐)
  • 隐式索引:使用整数作为索引值,使用.iloc[ ](推荐)
s = pd.Series(dict(a=1,b=2,c=3,d=4))
s['a'], s[1], s.c
s.loc['a'],s.iloc[1]

⇒ \Rightarrow 1,2,3
⇒ \Rightarrow 1,2

切片
s[0:-1]
s['a':'d']
s.loc['a':'d']  # 显式切片
s.iloc[0:-1]  # 隐式切片

⇒ \Rightarrow 1,2,3,4

属性方法
  • ndim维度
  • shape形状
  • size尺寸
  • dtype数据类型
  • index索引
  • keys()键(索引)
  • values
  • nbytes大小
  • head()快速查看
  • tail()快速查看

二、DataFrame

  • DataFrame是一个【表格型】的数据结构,可以看做是【由Series组成的字典】(共用同一个索引)。
  • DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到多维。
  • DataFrame既有行索引,也有列索引,,可以看成二维的Series
  • 行索引:index
  • 列索引:columns
  • 值:values(numpy的二维数组)
创建
  • 由numpy数组创建
pd.DataFrame(data=np.random.randint(1,20,(5,4)) ,index=['a','b','c','d','e'] ,columns=list('ABCD'))
  • 由字典列表创建
  • 字典的key自动变成列索引:columns
pd.DataFrame(data=[{'a': 1, 'b': 2, 'c': 3}, {'a': 1, 'd': 2, 'c': 3}, {'a': 2, 'b': 3, 'c': 4}])
索引
对列进行索引
  • 通过类似字典的方式
  • 通过属性的方式
  • 可以将DataFrame的列获取为一个Series。返回的Series拥有原DataFrame相同的索引,且name属性也已经设置好了,就是相应的列名。
data = pd.DataFrame(data=np.random.randint(1,20,(5,4)) ,index=['a','b','c','d','e'] ,columns=list('ABCD'))
data['A'],data.A

DataFrame的中括号,只能获取列索引。

对行进行索引
  • 使用.loc[ ]加index来进行行索引
  • 使用.iloc[ ]加整数来进行行索引
  • 同样返回一个Series,index为原来的columns。
data.loc['a'].B, data.T.a.B
对元素索引的方法
  • 使用列索引
  • 使用行索引(iloc[3,1]相当于两个参数;iloc[[3,3]] 里面的[3,3]看做一个参数)
  • 使用values属性(二维numpy数组)
data.iloc[0,0]
切片
  • 显式切片iloc
data.loc['a':'e', '2':]
  • 隐式切片iloc
data.iloc[0:-1,2:]
属性方法

基本继承Series的属性

  • index行索引
  • columns列索引
  • ndim维度
  • shape形状
  • size尺寸
  • dtype数据类型
  • keys()键(索引)
  • values
  • nbytes大小
  • head()快速查看
  • tail()快速查看
  • info()信息大小
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值