立即学习:https://edu.csdn.net/course/play/26990/361119?utm_source=blogtoedu
序列的创建方法,通过pandas.Series创建
pandas.Series(data,index,dtype,name)
data数组array、列表、字典dict
index所以必须与对象同长度
name对象的名称
用type()函数运行一下可知是不是序列机构 浮点型数据float64
字典:(【‘北京’:3.1,‘上海’:2.8……】)这样的 左边的key作为行索引,右边是value值
访问可以 变量【0】第一个值 变量【0:3】前三个索引+值通过位置访问是左开右闭的 也可以通过索引名称访问 变量【‘北京’】
Series切片可以通过索引访问一段数据的健和值:变量【‘北京’:‘江苏’】(通过标签访问不是左开右闭,而是左闭右也闭)
输出值 变量.value 输出的是array数组结构
输出行索引 变量.index
变量.dtype可以看到值的数据类型
dataFrame表结构,类似excel
参数columns是列名,相当于excel做分析时的表头
变量.head(5) 会显示表格
还可以使用字典方法创建,字典的key就会成为表头也就是列标签,值会成为每一列的数据
还可以通过数组创建 先创建np.array作为列标签下面对应的值,然后再加上columns参数写上列标签也就是表头,还可以给行索引index
有一些方法:变量.values可以把表格的值编程数组结构输出
.index就是输出行索引标签
.columns就是输出变量名称也就是行标签,但是这个数据结构不是一个列表 如果是.columns.tolist()那么就可以把数据结构转换为一个列表(这个方法只有DataFrame有,Series没有这种方法)
.ndim可以输出表格的维度,二维的就是由行和列构成的
.shape几行几列(行数,列数)如果是一维数据结构只会显示(行数,)
.size几个元素构成的,比如三行三列那就是9个元素
.dtype是每个列标签的数据类型,会显示列标签及其数据类型,数组型object,如果数字用‘’包含则是数组型,如果只是数字则是整数形或者浮点数