学习笔记(02):Python数据清洗实战-Pandas常用数据结构dataframe和方法

立即学习:https://edu.csdn.net/course/play/26990/361119?utm_source=blogtoedu

序列的创建方法,通过pandas.Series创建

pandas.Series(data,index,dtype,name)

data数组array、列表、字典dict

index所以必须与对象同长度

name对象的名称

用type()函数运行一下可知是不是序列机构 浮点型数据float64

字典:(【‘北京’:3.1,‘上海’:2.8……】)这样的 左边的key作为行索引,右边是value值

访问可以 变量【0】第一个值 变量【0:3】前三个索引+值通过位置访问是左开右闭的 也可以通过索引名称访问 变量【‘北京’】

Series切片可以通过索引访问一段数据的健和值:变量【‘北京’:‘江苏’】(通过标签访问不是左开右闭,而是左闭右也闭)

 

输出值 变量.value 输出的是array数组结构

输出行索引 变量.index

变量.dtype可以看到值的数据类型

 

dataFrame表结构,类似excel

参数columns是列名,相当于excel做分析时的表头

变量.head(5) 会显示表格

还可以使用字典方法创建,字典的key就会成为表头也就是列标签,值会成为每一列的数据

还可以通过数组创建 先创建np.array作为列标签下面对应的值,然后再加上columns参数写上列标签也就是表头,还可以给行索引index

 

有一些方法:变量.values可以把表格的值编程数组结构输出

.index就是输出行索引标签

.columns就是输出变量名称也就是行标签,但是这个数据结构不是一个列表 如果是.columns.tolist()那么就可以把数据结构转换为一个列表(这个方法只有DataFrame有,Series没有这种方法)

.ndim可以输出表格的维度,二维的就是由行和列构成的

.shape几行几列(行数,列数)如果是一维数据结构只会显示(行数,)

.size几个元素构成的,比如三行三列那就是9个元素

.dtype是每个列标签的数据类型,会显示列标签及其数据类型,数组型object,如果数字用‘’包含则是数组型,如果只是数字则是整数形或者浮点数

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值